Verksamhetsberättelse 2017/Story: Massuppladdning av data

Under de senaste åtta åren har vi arbetat med massuppladdning av mediefiler. I år har vi dock lagt stora ansträngningar på massuppladdningar av data. Grunden som vi har lagt kommer att möjliggöra för WMSE att hjälpa till att leverera information av hög kvalitet och uppdaterad information för en stor mängd Wikipedia-artiklar och Wikidata-objekt. Arbetet hjälper också oss att förbereda oss för framtiden då Wikimedia Commons kommer att ha strukturerad data om mediafilerna. De massuppladdningar av mediafiler som vi då gör kommer att vara sammanlänkade med massuppladdningar av data.

Vi har huvudsakligen fokuserat på olika typer av geografiska data, eftersom detta har identifierats som värdefullt av Wikipedia-skribenterna. Mer specifikt har vi fokuserat på data om byggt kulturarv genom projektet Kopplat Öppet Kulturarv, på sjöar i Sverige, genom WFD-data till Wikidata och skyddade naturområden, som förberedelse inför fototävlingen Wiki Loves Earth. John Cummings, vars arbete vid UNESCO vi finansierade, har under tiden arbetat för att släppa loss data från UNESCO.

Vi har arbetat med att dokumentera de olika steg som behövs för en massuppladdning av data samt utvecklat instruktionsmaterial. Vi har fortsatt att träna våra nya utvecklare, skrivit ny kod och identifierat sätt för gemenskapen att bidra till arbetet. För att se till att den data vi tillgängliggör används samt för att stimulera fler organisationer att på sikt släppa sin data har vi också utvecklat sätt att inkludera data i mallar på svenskspråkiga Wikipedia. Vi stödde även utvecklingen av Monumental, ett verktyg för att visualisera data på Wikidata.

Genom projektet Kopplat Öppet Kulturarv uppdaterade vi eller skapade mer än 330 000 Wikidata-objekt från 27 länder. Detta tvingade oss att se till att skapa en strömlinjeformad uppladdningsprocessen där flera dataset har ett liknande format, men där den faktiska data som de innehåller skiljer sig avsevärt. Även om det finns fler dataset från Wiki Loves Monuments som kan migreras så gör de ramar vi byggde det enklare för alla som besitter teknisk kunskap.

En sak som tar mycket tid och ansträngning i anspråk är det noggranna urvalet av vilka data i ett dataset som ska inkluderas i massuppladdningen. Vi har kontinuerligt arbetat för att engagera volontärer att bidra med sin kompetens för att städa i samt förbereda data. Deras aktiva involvering bidrar till att säkerställa att det blir korrekt samt gör att vi kan undvika irritation och frustration från gemenskaperna.

Vi planerar nya projektförslag kring massuppladdning av data för 2018.