Projekt:Wikispeech 2016

Från Wikimedia
Hoppa till navigering Hoppa till sök
2018 >>
Det här kan du som frivillig hjälpa oss med!
Utveckling av talsyntesen Ta en titt på Phabricator och se om det är någon öppen uppgift som du kan hjälpa till med!
Om du är nyfiken och vill ha mer information om specifika uppgifter, ta kontakt med john.andersson(at)wikimedia.se

Kort projektbeskrivning

Wikipedia (WP) är en av världens mest använda webbplatser med ca 500 miljoner besökare varje månad och ca 20 miljarder sidvisningar. WP är en s.k. wiki och använder mjukvaran MediaWiki i bakgrunden. MediaWiki används av många tusen andra webbplatser och detta projekt syftar till att skapa den programvara som behövs för att talsyntes skall kunna användas på alla dessa och optimerad på WP. Artiklarna innehåller många fackuttryck vilket gör att talsyntesens uttalslexikon måste vara mycket omfattande. Därtill finns Wikipedia på 288 olika språk, och plattformen skall vara skalbar till alla de språken, samt alla framtida.

Flexibilitet är därför centralt. Initialt sätts Wikispeech upp för svenska, engelska samt ett höger-till-vänster-språk (arabiska). All programvara och allt material kommer att vara open source för att utvecklare från hela världen skall kunna hjälpa till. Det kommer även att bygga på crowdsourcing och på så sätt tillgodogöra sig den språkliga expertis som finns hos de tiotusentals volontärer som är involverade i Wikimedias olika projekt. Genom att användargenerera talsyntesen med inspelningar av de specialiserade texterna kan vi med tiden nå en förfinad och högkvalitativ talsyntes även i obskyra ämnen på språk som tidigare helt saknat en fungerande talsyntes. Genom detta projekt sätter vi upp det ramverk som behövs för detta.

Allt producerat material, oavsett typ, kommer att vara fritt licensierat och därmed vara möjligt att gratis återanvändas av vem som helst.

Ett exempel på hur Wikispeech troligtvis kommer att låta.

Tidplan

Se Fil:Wikispeech Etapprapport 2, Bilaga 1 - Uppdaterad projektplan.pdf för nyaste tidsrevideringen av det tekniska arbetet.

Datum Aktivitet Kommentar Phabricator

Wikispeech

1 januari-15 september Utveckling pågår För grundläggande funktionalitet samt för aktivering av Wikispeech på svwp, enwp och arwp. Wikispeech
21-28 februari Arbete på Etapprapport 3
26-30 juni Arbete på Etapprapport 4
11-15 september Arbete på Etapprapport 5 (slutrapport)


Samarbetspartners

  • STTS
  • KTH

Se även

Projektdata

Projekt nr. 164201 Ansvarig John
Projektstart 2016-03-15 Projektslut 2017-12-31
Finansiär Budget
Post- och telestyrelsen. 2 406 479 kr från PTS, varav 1 146 500 kr under projektet utbetalas till underleverantören Södermalms Talteknologiservice AB (STTS).

KTH:s del i projektet finansieras genom en direkt utbetalning till dem från PTS av momsskäl (ingen moms när utbetalningar går direkt mellan myndigheter).

Interna mål   Externa mål
  • A.2.2a - Wikispeech aktiveras som betafunktion på 3 språk.
  • M.2a - Delta på 1/4 int. Wikimedia-evenemang.  

Att skapa en inbyggd talsyntes för MediaWiki (fokus på sv., en. och ar.Wikipedia), som ett tillägg.

Slutrapport/utvärdering Fil:Wikispeech - Slutrapportering projektgenomförande.pdf 
Lägesrapport: 
Uppdaterad senast 2017-09-08 STATUS Button Icon GreenForest.svg
Utförda aktiviteter Måluppfyllnad
  • De viktigaste funktionerna på spelaren finns nu på plats. Det går att lyssna på Wikispeech här: https://wikispeech.wmflabs.org/wiki/Main_Page
  • Vi har hittat en utvecklare på WMF som hjälper oss med kod- och säkerhetsgranskning för att möjliggöra aktivering.
  • Vi har presenterat om Wikispeech på Wikimania 2017. Detta mottogs väl (ex.).
  • Vi har ställt ut på konferensen Interspeech i Stockholm tillsammans med PTS.
  • Vår volontär har fått sin första kod inkluderad i projektet.
  • Implementerade segmentering av HTML-taggar. Detta tillåter att lägga till pauser bl.a. mellan rubriker och följande text samt mellan rader i listor.
  • Implementerade API för förprocessning av HTML, vilket begränsar nätverksanvänding. API:et kan också användas utanför Wikispeech, när tvättad text behövs.

För tidigare aktiviteter se: Projekt:Wikispeech 2016/Aktivitetslogg

Har deltagit på 3 internationella Wikimedia-evenemang.

Viktigt nästa månad Öppna huvudsakliga problem

Trots löfte om att ta fram en plan för hur WMF kan kod- och säkerhatsgranska Wikispeech har vi inte fått något konkret (trots upprepade påminnelser).

Aktuell kostnad Dragna erfarenheter
Kommentar från verksamhetschefen