Verksamhetsberättelse 2021/Story: En strukturerad satsning på Strukturerade Data på Commons

Från Wikimedia
Hoppa till navigering Hoppa till sök
Det här är en översatt version av sidan Annual Report 2021/Story: A structured effort on Structured Data on Commons. Översättningen är till 100 % färdig och uppdaterad.
Access
2021

I den här Storyn ger vi en översikt över vårt storskaliga arbete med Structured Data on Commons, inklusive datauppladdningar, outreach och dokumentation.

Efter att ha berikat bilder från Wiki Loves Monuments i Sverige med deltagarinformation kan vi köra alla sorters queries med dem – till exempel kan vi visualisera var korten är tagna och vilka tävlingar de deltog i.

Structured Data on Commons (SDC) är ett modernt, strukturerat och maskinläsbart sätt att beskriva de miljontals bilder, ljudklipp och videoklipp som finns på Wikimedia Commons, och har gått långt sedan det först implementerades år 2017. SDC gör filerna lättare att visa, söka, redigera, organisera och återanvända på många språk. Det har blivit rätt så populärt inom Wikimediagemenskapen, och fler och fler användare aktivt lägger till data till filerna de laddar upp.

Men det finns fortfarande mycket att göra. Det finns 80 miljoner filer på Wikimedia Commons; av dessa har 7 miljoner ett motiv-uttalande och 1.7 miljoner ett skapare-uttalande. Många användare har flitigt jobbat på att förbättra dessa siffror, men vad vi verkligen behöver är verktyg och arbetssätt för att snabbt och effektivt arbeta med stora mängder filer. Detta gäller både Wikimediagemenskapen och våra GLAM-partners, som kan dra nytta av att SDC gör deras samlingar lättare att hitta och analysera. Genom att använda botar för att lägga till grundläggande information kan gemenskapen fokusera sina insatser på områden där det behövs mänsklig analys och beslutstagande.

Det är därför när vi satte igång projektet Stöd för innehållspartnerskap 2021 åtog vi oss att ladda upp 1 miljon SDC-uttalanden till filer på Wikimedia Commons. Vårt mål, förutom att bidra med värdefullt data till Wikimediaprojekten, var att stärka vår kompetens inom relevanta områden inför fortsatt hubbarbete, samt att testa tillgängliga verktyg och utveckla effektiva arbetsflöden för att bearbeta och ladda upp stora mängder strukturerade data till Wikimedia Commons. Målet uppnåddes i december 2021, halvvägs genom projektet, och därför förbereder vi oss för att ladda upp ytterligare en 1 miljon SDC-uttalanden under 2022, som ett sätt att bygga vidare på den första framgången.

Vi riktade våra insatser huvudsakligen mot bilder från Wiki Loves Monuments-tävlingarna runt om i världen. När de väl berikats med SDC blir bilderna, som laddats upp av tusentals frivilliga fotografer, lättare att hitta och förstå, och därmed mer värdefulla. Tack vare utvecklingen och lanseringen av MediaSearch, en ny sökmotor för Wikimedia Commons som använder sig av SDC, det strukturerade datat kan användas för att leverera bättre sökresultat till alla.

För att vidare dela med oss av våra erfarenheter och nätverk med andra som intresserar sig för SDC deltog vi flera evenemang, som konferenser och workshops. Vi hoppas att detta kommer att väcka mer intresse bland deltagarna att bidra till datat mer aktivt. Det finns enormt mycket att göra och för att skapa större nytta måste vi jobba tillsammans.

Structured Data on Commons utvecklas fortfarande. Den tekniska biten är på plats – alla kan lägga till och redigera uttalanden – men god praxis för modellering, verktyg och så vidare är en ständigt pågående process. Ett verktyg som kommer ge Wikimediagemenskapen förbättrade möjligheter att bidra till SDC är OpenRefine, som har fått finansiering för att implementera Wikimedia Commons-funktioner. Detta arbete startade i mitten av 2021 och WMSE har följt det noga; vi har deltagit i designdiskussioner och delat med oss av våra erfarenheter från att ha utbildat Wikimedianer och GLAM-personal om SDC. Vi ser mjukvaran växa och förbättras i realtid och är bland de första att se och testa de nya funktionaliteterna, vilket kommer att göra möjligt för oss att delta i att ta fram dokumentation och utbilda andra. Vi är stolta över denna möjlighet att bidra till vidareutvecklingen av verktyget, som vi använder mycket för vårt Wikidataarbete. Vi har också hjälpt till med att förbättra annan viktig mjukvara som ISA tool och Pattypan, som bägge två är av central betydelse för Wikimedianer och GLAM-personal som vill bidra till Wikimediaplattformarna (se även våran Story om hur vi stödjer frivilliga utvecklare).