Verksamhetsberättelse 2019/Story: Att samla in taldata för alla

Från Wikimedia
Hoppa till navigering Hoppa till sök
Användning
2019

I den här Storyn beskriver vi om hur vi lägger grunden för ett verktyg som samlar in taldata. Vår ambition är att förbättra Wikipedias tillgänglighet och att, med hjälp av AI, minska problemen för minoriteter.

Talteknologi, som text-till-tal och taligenkänning, kan vara ett fantastiskt verktyg när text i skriven form inte passar. Det handlar bland annat om situationer där man redan tittar på något eller har händerna upptagna. Det kan även vara användbart, och till och med nödvändigt, om man av någon anledning har svårt att läsa, exempelvis på grund av nedsatt syn, dyslexi eller låg utbildningsnivå.

Under vårt arbete med det ursprungliga Wikispeech-projektet upptäckte vi att det rådde brist på öppet tillgängliga taldata, det vill säga inspelningar av tal. Det förhindrar utvecklingen av text-till-tal och taligenkänningslösningar för nya språk, och för människor med olika rösttyper eller dialekter. För att lösa detta problem behövs mer data – mycket mer data.

Detta är särskilt aktuellt inom språk där det inte finns så mycket kommersiella intressen för utveckling av nya lösningar. Det är just de här språkens talare som skulle gynnas mest av funktionerna. Under året utvecklade vi en fortsättning på projektet Wikispeech, som fokuserar på verktyg för att samla in taldata genom crowdsourcing. På detta sätt kommer Wikimediagemenskapen kunna hjälpa till och fylla luckorna. Vi hoppas att data och verktyg kommer att ha en nyckelroll i infrastrukturen för tillgänglighet.

EU-direktivet (2016/2102) om tillgänglighet avseende offentliga myndigheters webbplatser och mobila applikationer har nu trätt i kraft. För att verktyg som är byggda för den offentliga sektorn inom EU ska kunna implementeras, måste de innehålla funktioner för tillgänglighet. Detta knyter an till våra insatser för att utveckla verktyg för partnerorganisationer som vill dela sitt innehåll på våra plattformar. Vi måste bygga tillgängliga verktyg, vilket vi hoppas kommer att bli möjligt tack vare detta projekt.