Hoppa till innehållet

Verksamhetsberättelse 2024/Story: Viktiga bidrag till OpenRefine – ett centralt verktyg

Från Wikimedia
Tillgång
2024

I denna story fokuserar vi på vår vidareutveckling av mjukvaran OpenRefine som ett exempel på vårt engagemang i externa verktyg som gynnar alla som arbetar med öppen kunskap.

OpenRefine är ett program, utvecklat som öppen källkod, för att analysera och redigera datamängder samt ladda upp dem till Wikidata och Wikimedia Commons. Vi använder OpenRefine flitigt inom våra olika projekt. När det gäller arbete med Wikidata är det ett nyckelverktyg, eftersom det kan användas i alla steg av processen: att analysera en datamängd för att bedöma om den överhuvudtaget är intressant och relevant för öppna kunskapsplattformar; att bearbeta data för att anpassa det till Wikidatas struktur; och att slutligen ladda upp det antingen som nya Wikidataobjekt eller som förbättringar av befintliga objekt. På det sättet har vi använt oss av OpenRefine i många år och har alltså byggt upp vår expertis.

Sedan ett tag tillbaka kan OpenRefine även användas för att interagera med Wikimedia Commons, mediadatabasen för Wikimediaprojekten, inte minst för att ladda upp nya filer, som bilder och ljudinspelningar. Samarbete med GLAM-institutioner som vill dela med sig av sina digitiserade samlingar är en betydande del av vår verksamhet, varför vi mottog och omfamnade den nya utvecklingen med glädje. Dock hade mjukvaran en viss begränsning: det gick bara att ladda upp filer på mindre än 100 MB. En smolk i bägaren för oss och alla andra som arbetar med GLAM-samlingar, eftersom det just är museer och arkiv som oftast förfogar över högupplösta bilder och andra stora filer och vill få dem publicerade på Wikimedia Commons.

Detta är bakgrunden till varför vi valde att aktivt arbeta med att vidareutveckla OpenRefine under 2024. Filstorleksbegränsningen var av teknisk natur: stora filer laddas nämligen upp på ett lite annat sätt, uppdelade i mindre bitar. Detta är naturligtvis ingenting användaren märker, men det kräver en lite mer komplex teknisk lösning bakom kulisserna. Eftersom vi har både kompetenta programmerare och hängivna OpenRefine-användare i personalstyrkan var det ingen tvekan om att vi hade möjlighet att bidra och göra mjukvaran mer användbar för alla. Och tack vare vårt långvariga engagemang i gemenskapen kring OpenRefine, som verktygets användare, hade vi både en bra dialog med utvecklarna och en insikt i vilka andra smärre förbättringar vi skulle kunna bidra med, vilket vi också gjorde.

Förutom att använda och bidra till OpenRefine hjälper vi också andra att förstå och implementera verktyget i sitt arbete. Kulturarvsinstitutioner, som vi dagligen samarbetar med, har ju också ett behov av kraftfulla och flexibla verktyg för att arbeta med stora datamängder, oavsett om de vill jobba med Wikimediaplattformar eller behöver städa sina data för internt bruk. Vi är en liten organisation, så det är omöjligt för oss att uppnå vår mission – fri kunskap för alla – om vi inte engagerar flera, särskilt ämnesexperter, och hjälper dem att bli självständiga.

Därför utvecklar och erbjuder vi utbildningstillfällen i länkade öppna data för GLAM-institutioner, där OpenRefine är en viktig pusselbit. Ett exempel på detta är projektet Ett nätverk av platser, där vi stödjer ett antal institutioner – ArkDes, Riksantikvarieämbetet, Nationalmuseum och Tekniska museet – i deras arbete med bebyggelsedata på Wikimedias plattformar. Snarare än att själva ladda upp data till Wikidata har vi en stödroll, med målet att projektdeltagarna ska börja känna sig bekväma på Wikimediaplattformarna och kunna sprida kunskap om Wikidata och OpenRefine, både till sina kollegor och andra GLAM-verksamma i Sverige och andra länder.

Tack vare OpenRefine har tröskeln till att börja jobba med stora datamängder och Wikidata aldrig varit så låg. Verktyget är betydligt användarvänligare än de lösningar som vi själva använde för bara ett antal år sedan. Vi är glada över möjligheten att få bidra med en liten men betydande insats till mjukvaran som används av Wikimedianer och GLAM-verksamma världen över – och som nu även är ett fullgott verktyg för att ladda upp filer till Wikimedia Commons, oavsett storlek.

Med denna insats markerar vi Wikimedia Sveriges roll inom den globala Wikimediagemenskapen: vi har koll på vilka verktyg och stödinsatser som behövs och bidrar gärna inom områden där vi har möjlighet att gynna hela rörelsen för öppen kunskap. Vi ser vårt bidrag som en viktig pilot för vårt fortsatta arbete inom den tematiska hubb för innehållspartnerskap som vi håller på och utvecklar. Syftet med hubben är att göra det lättare för den globala rörelsen att planera och genomföra lyckade innehållspartnerskap – till exempel samarbeten med GLAM-institutioner – vilket kräver ändamålsenlig och välfungerande teknisk infrastruktur. OpenRefine är nu ett centralt verktyg för Wikimedianer som arbetar med data och mediefiler, varför det är viktigt att det underhålls och vidareutvecklas för att uppfylla användarnas behov. Som en framtida hubb har vi en unik position där vi kan kan bidra med våra färdigheter; en enstaka utvecklingsinsats kan resultera i starkare och effektivare innehållspartnerskap runt om i världen framöver.