Projekt:Wikispeech – Talresursinsamlaren 2019/Integrering av Talresursinsamlaren
MediaWiki-tillägg
(some del av Wikimedias produktionsinfrastruktur)
Fördelar
- Kan dra nytta av funktionalitet som redan finns i MediaWiki.
- Fillagring (tillfällig).
- Databasbiten.
- Gränssnitt.
- Närmare och mer naturlig koppling till Wikispeech Text-to-speech.
- Kanske kan bakas in direkt i spelaren.
- Mindre skillnad för slutanvändaren särskilt om hen är van vid MediaWiki.
- Särskilt gränssnitt.
- Vi tror främst att det är samma gemenskap som kommer att bidra.
- Tydligt ställningstagande att tillgänglighetsaspekter är en del av “kärnan”.
- Att TTS är i kärnan är ett tydligt sådant ställningstagande, Talresursinsamlaren är inte alls lika tydlig, det är inte det som den direkt används till.
- Högre prioritet gällande driftsäkerhet m.m. hos WMF.
- Insamlingen kan bli integrerad direkt på Wikipedia utan att bidragsgivaren behöver lämna Wikipedia.
- Samma url kan vara viktigt.
- Dock är Wikimedia Commons redan idag ett motexempel, likaså många populära verktyg.
- Samma inloggning.
- Kan åstakommas med OAuth.
- Kan finnas en poäng i att identifiera sig med Wikimedia inloggning, men inte knyta den uppladdade filen till denna [troligen]. Inte möjligt om det sker inifrån MediaWiki.
Nackdelar
- Måste godkännas av gemenskapen/-erna för att det ska aktiveras.
- Måste ändå ha buy-in från viss del av gemenskapen för att inspelning ska ske.
- Om det är en vidareutveckling av något som redan är påslaget kanske detta blir en icke-fråga.
- Kräver support och buy-in från WMF för att färdigställa och driftsätta.
- VIKTIG!
- Både vad gäller syftet (är det in-line med vad WMF känner är deras prio just nu)...
- ...och kodimplementationen.
- WMF kan bestämma sig för att stänga ned Talresursinsamlaren utan att fråga oss.
- Begränsad till de möjligheter som MediaWiki tillåter.
- Vi kan inte använda t.ex. bibliotek som inte är godkända av Wikimedia.
MediaWiki-tillägg men ej på Wikipedia
Alltså ett fristående verktyg där verktyget bygger på MediaWiki plattformen (LinguaLibre idag). MediaWikis för-/nackdelar utan WMFs för-/nackdelar.
- Kan bygga för att WMF i framtiden skulle kunna anamma det.
- Behöver inte besluta kringliggande komponenter och beroenden (t.ex. val av databas) men kan inte återanvända externa heller.
- Är det konstigt att man lämnar “sin” wiki och hamnar på en annan wiki för att spela in? (jfr. Lämnar Wikipedia och hamnar på Commons när man ska ladda upp en bild).
- Kan man använda OAuth från wikimedia-wiki till vår wiki?
- LinguaLibre kör OAuth mot Commons och genererar Användare utifrån det. Se t.ex. https://lingualibre.fr/wiki/Special:Preferences (efter OAuth).
Fristående verktyg
Fördelar
- Kan återanvändas av externa parter som inte använder MediaWiki.
- Lättare att sätta upp för användare (som inte har eller vill ha en wiki).
- D.v.s. andra parter som vill köra egna Talresursinsamlaren [även ingående komponenter] t.ex. för forskning, lokala insamlinsprojekt.
- En wiki är en onödig overhead om du bara vill samla taldata.
- Större frihet i utformningen av mjukvaran, t.ex. programmeringsspråk och ramverk.
- Kan göra de val vi själva är mest bekväma med.
- Kan bygga på samma sätt som liknande initiativ idag (dela komponenter).
- Lättare att återanvända existerande komponenter.
- Att inte behöva porta kod till PHP kan spara tid.
- Kan vara möjligt även om det är en MediaWiki extension med tjänster.
- Lättare att driftsätta innan den är helt färdigställd.
- Om vi t.ex. vill kunna börja spela in individuella ord innan vi byggt stöd för långa meningar.
- Större chans att något är uppe i slutet av projektet även om vi inte checkat av alla våra planerade mål.
Nackdelar
- Begränsningar i hur det går att länka från Wikispeech-tillägget
- Det finns begränsningar kring hur inbyggda saker får länka ut, kopplat till att användare inte ska kunna spåras. Det sagt så räknas Cloud VPS inte alltid som "ut" (finns flera tjänster där som är ett klick bort från Wikipedia) Se t.ex. https://sv.wikipedia.org/wiki/Stockholms_universitet?safemode=1. Och verktyg där har egentligen samma krav om att inte möjliggöra extern spårning.
- Påverkar bara oss.
- Behöver troligen driftsättas på Cloud VPS vilket har lägre driftsäkerhet än produktionsservrarna.
- Påverkar bara oss.
- Kräver att vi sätter upp viss infrastruktur t.ex. CI.
- En pipeline i CI för ett sådant projekt skulle vi ändå bli tvungna att konfigurera själva (åtminstone för tjänster) då det inte är en standardkomponent i MW med standardtester?
- Större krav på engagemang gällande produktägande och drift av server?
- Kan inte “lämnas över” till WMF på samma sätt som en extension med tjänster.
- Wikimedia Sverige “förbinder sig” att underhålla och ansvara för tjänsten tills dess att den läggs ner.
- Se punkten ovan om att WMF kan välja att stänga av Talresursinsamlaren på egen hand.
Sammanfattningar
Kalle: Sparar tid på MW men får ett bättre verktyg som fristående. Inget alternativ är dåligt.
Sebastian: Att ta MediaWiki med det som finns är troligen enklare än att söka efter existerande komponenter. MediaWiki som fristående verktyg lockar.
André: MediaWiki som fristående verktyg har den ofantliga fördelen att WMF inte kan blocka. Orolig över hur STTS och KTH:s grejer passar in i begränsningar i MediaWiki (speciellt för inbyggnad i Wikipedia). För att att ha MediaWiki som externt verktyg tror jag vi behöver skohorna in funktionalitet för att ta folk tillbaka till spelaren/hemwikin.
Beslut
Satsar på MediaWiki-tillägg som kan köras likt ett fristående verktyg men med WMFs infrastruktur i åtanke under utveckling. I första hand körandes på Cloud VPS.
Kostnaden är att integration med Wikispeech TTS blir avsevärt mindre (kan åtgärdas senare om WMF anammar). Dvs. en länk som kan skicka med information/parametrar.
Kan även behöva separera (i kodbasen) det som vår wiki behöver, gentemot vad MW-tillägget i sig själv behöver (oavsett om den kör hos oss eller på Wikipedia).
Effekter/Implementering [förslag]
- Talresursinsamlaren blir ett separat MediaWiki-tillägg från Wikispeech.
- Talresursinsamlaren-tillägget får kräva att Wikispeech/Speechoid är installerat på samma wiki[så att den kan återanvända existerande funktionalitet].
- Talresursinsamlaren-tillägget bör inte vara starkt kopplad till Wikispeech spelare/UI [då en användare lär starta från en annan wiki].
- Talresursinsamlaren-verktyget ska inte vara beroende av innehållet på wikin (möjligen undantaget någon enstaka hjälpsida) [då detta inte fungerar om den aktiveras på Wiki(p|m)edia-wikis].