Hoppa till innehållet

Önskelista/Catapp KTH-uppgift

Från Wikimedia

Beskrivning av ert företag/organisation/bransch

Wikimedia Sverige är en ideell allmännyttig förening som arbetar för att göra kunskap fritt tillgänglig för alla människor. Föreningen driver mängder av olika projekt som syftar till att göra mer kultur och historia tillgängligt online, och framförallt på Wikipedia. Föreningen hjälper lärare och bibliotekarier att använda Wikipedia, arkiv och museer att nå ut med sitt material samt stödjer volontärerna så att de kan bidra enklare och med högre kvalitet.

Vad handlar projektet om?

Wikipedias mediedatabas Wikimedia Commons innehåller mer än 29 miljoner bilder som är fria att använda. Men i den stora massan blir det svårt att hitta det man söker efter. Ett sätt att göra bilder enklare att hitta och filtrera på är att lägga till bilder i kategorier. Kategorier gör också att bilderna blir klassificerade på ett maskinläsbart sätt vilket öppnar dörren för nya applikationer att bygga vidare på detta. Med ett kategorisystem som är uppbyggt hierarkiskt, som en taxonomi, kan man stega sig uppåt till mer generella och övergripande begrepp eller borra sig djupare ner i det mer specifika. Själva kategorisystemet i sig kan alltså vara en sökväg efter bilder. Med bättre kategorier kommer bilderna att nå slutanvändarna enklare och ge dem ett större värde. För museer och arkiv som är involverade uppfyller de enklare sitt uppdrag att göra materialet tillgängligt för allmänheten.

Det finns ett kategoriseringssystem på Wikimedia Commons idag, men problemet är att många, framförallt nybörjare, inte tar sig tid att lägga bilderna i en bra kategori. Kategorisystemet är både brett och djupt och det är inte helt enkelt att genomskåda vilka kategorier en bild ska tillhöra. I dagsläget finns cirka 600 000 okategoriserade bilder och cirka 1 000 nya okategoriserade bilder tillkommer varje dag.

Det fanns tidigare ett hjälpmedel för detta, där det baserat på matchning av övrigt metadata i filen och kategorier som redan finns i databasen genererades förslag på kategorier. Även om verktyget inte fungerar längre kan man återanvända idéer på algoritmen för kategoriförslag. Den hade dock en stor begränsning. Den var inte anpassad för en mobil, vilket var synd då aktiviteten att göra en bedömning om en bild passar i en kategori eller inte är ett utmärkt sätt att spendera en minut på medan man väntar på bussen.

Utkast på arbetsflöde

Projektet har tidgare varit en design/speldesign uppgift på Umeå universitet så det finns en del idéer på att starta arbetet ifrån.

Vilka är målen/leverablerna/resultaten?

Målet är en webbapp, helst responsiv, som klarar av att kategorisera bilder.

Webbappen måste vara öppen källkod och publiceras under en fri licens, som till exempel GPL eller MIT.

Eventuella lämpliga förkunskaper

Vilka teknologier etc de får arbeta med

Mediawiki, HTML, Javascript, oAuth

Kontaktuppgifter

Jan Ainali, jan.ainali(at)wikimedia.se, 0729-672948