Hoppa till innehållet

Projekt:Wikidata för auktoritetskontroll/Översikt/Evenemang och publikationer/Enkätundersökning 2023

Från Wikimedia
Wikidata för auktoritetskontroll



Användbara auktoriteter för datadriven samlingsforskning - Enkätundersökning hösten 2023

Resultat från enkätundersökning om värdet med länkade öppna kulturarvsdata via Wikidata

Om projektet och enkäten

Projektet Användbara auktoriteter för datadriven samlingsforskning skickade under hösten 2023 ut en enkät för att undersöka hur forskare och anställda på kulturarvsinstitutioner ser på länkade kulturarvsdata. Projektet ville särskilt undersöka hur de svarande såg på värdet med länkade öppna kulturarvsdata och om de ansåg att länkade öppna kulturarvsdata underlättar för kulturarvsforskning.

Projektet Användbara auktoriteter för datadriven samlingsforskning har under tre år (2021–2023) arbetat med att koppla vokabulärer från Statens historiska museers och Nationalmuseums databaser till Wikidata. Runt 40 000 auktoritetsposter från institutionernas databaser har nu koppling till Wikidata. För att tydliggöra resultatet av projektets arbete har också ett antal visualiseringar av de sammanlänkade och öppna datamängderna producerats. Projektets syfte är att utreda om vokabulärer som länkad data stimulerar ny datadriven forskning på museisamlingar och om Wikidata är en lämplig plattform att använda sig av för att länka samman olika auktoriteter och vokabulärer. Detta genom att utveckla en metod för att göra svenska personauktoriteter kompatibla med varandra, dvs genom att öka museisamlingars semantiska interoperabilitet. Projektet vill också med hjälp av visualiseringar av samband mellan historiska personer och föremål underlätta förståelse av annars ogreppbara och abstrakta datamängder. Ett ytterligare syfte är att höja kompetensen om länkade data och dess potential inom kulturarvssektorn.

Den metod som projektet använt för att koppla institutionernas auktoritetsposter till Wikidata med hjälp av verktyget OpenRefine kommer att göras tillgänglig i videoformat för att kunna återanvändas av andra kulturarvsinstitutioner som är intresserade av att gör ett liknande arbete med länkade öppna data via Wikidata.

Projektet drivs av Nationalmuseum i samarbete med Statens historiska museer och Wikimedia Sverige och har finansierats under tre år av Riksantikvarieämbetets medel för forskning och utveckling på centrala museer.

Om de svarande

Huvudsaklig sysselsättning

25 personer svarade på enkäten. Majoriteten av de svarande arbetar på museum. Ett mindre antal svarande arbetar med forskning, på arkiv eller annan kulturarvsinstitution. De svarande kunde välja högst tre alternativ för vad de i huvudsak arbetar med.

Vad arbetar du i huvudsak med?

Välj högst 3 alternativ.

  • Arkiv (2)
  • Bibliotek (0)
  • Museum (21)
  • Universitet/högskola (0)
  • Skola (0)
  • Annan kulturarvsinstitution (2)
  • Forskning (2)
  • Applikationsutveckling/programmering (0)
  • Annat, fritextsvar:

  • Arkeolog och samlingsförvaltare (1)
  • Intendent (1)
  • Myndighet (1)
  • Strategiskt arbete inom ABM-sektorn (1)
  • Verksamhetsarkitektur och informationssäkerhet (1)
  • Webb (1)

Kännedom om Wikimedia-plattformarna

Alla som svarade på enkäten har hört talas om Wikidata och Wikimedia tidigare. De flesta är ganska bekanta med Wikidata och några är mycket bekanta med Wikidata. Av Wikimedias andra plattformar (exempelvis Wikipedia eller Wikimedia Commons) svarar nästan hälften av deltagarna att de är mycket bekanta och många svarar att de är ganska bekanta.

Hur väl bekant är du med Wikidata sedan tidigare?
  • Inte alls bekant (0)
  • Har hört talas om det (1)
  • Ganska bekant (18)
  • Mycket bekant (6)

Hur väl bekant är du med andra Wikimedia-projekt, t ex Wikipedia och Wikimedia Commons?
  • Inte alls bekant (0)
  • Har hört talas om det (2)
  • Ganska bekant (11)
  • Mycket bekant (12)

Användning av digital och analog information om kulturarvssamlingar

Enkätens deltagare svarar att de använder digitaliserade information om kulturarvssamlingar ofta, ganska ofta och några få svarar att de använder det ibland. Exempelvis genom institutionernas egna söktjänster, K-Samsök, KulturNav, Europeana eller Wikidata. Endast en svarar att den aldrig använder digitaliserad information om kulturarvsamlingar. Deltagarna svarar däremot att när det gäller ej digitaliserad information om kulturarvssamlingar (exempelvis besök i arkiv eller magasin för forskning) använder de sig aldrig, sällan eller endast ibland av den typen av information; totalt sett tre fjärdedelar av svaren. Cirka en fjärdedel av enkätens deltagare svarar att de aldrig använder sig av analog information om kulturarvsamlingar. Cirka en fjärdedel svarar att de gör det ofta eller ganska ofta.

Hur ofta använder du digitaliserad information om kulturarvssamlingar, t ex på plattformar som Wikidata, Europeana, K-samsök eller institutionernas egna söktjänster?
  • Aldrig (1)
  • Sällan (0)
  • Ibland (5)
  • Ganska ofta (9)
  • Ofta (10)

Hur ofta använder du ej digitaliserad information om kulturarvssamlingar, t ex genom samlingsbesök, besök i arkiv eller genom att beställa fram material?
  • Aldrig (6)
  • Sällan (7)
  • Ibland (6)
  • Ganska ofta (4)
  • Ofta (2)

Värdet med sammanlänkade kulturarvsdata

Alla svarande tycker att det är viktigt att kulturarvsinstitutioner tillgängliggör sin information på sätt som möjliggör sammanlänkning med andra datakällor. Likaså anser de svarande att det är mycket viktigt för kulturarvsforskning att kulturarvsinstitutionernas datamängder finns tillgängliga på gemensamma öppna plattformar. Alla förutom en anser att det är mycket viktigt.

Hur viktigt anser du att det är att kulturarvsinstitutioner tillgängliggör sin information på ett sätt som möjliggör sammanlänkning mellan olika datamängder, t ex som länkade öppna data?
  • Inte viktigt (0)
  • Ganska oviktigt (0)
  • Varken viktigt eller oviktigt (0)
  • Ganska viktigt (1)
  • Mycket viktigt (24)

Hur viktigt anser du att det är för kulturarvsforskning att kulturarvsinstitutionernas datamängder finns tillgängliga på gemensamma öppna plattformar?
  • Inte viktigt (0)
  • Ganska oviktigt (0)
  • Varken viktigt eller oviktigt (0)
  • Ganska viktigt (1)
  • Mycket viktigt (24)

Fördelar med sammanlänkat kulturarv

Majoriteten av de som svarat på enkäten ansåg att de främsta fördelarna med sammanlänkat kulturarv via Wikidata är möjligheten att hitta information från olika kulturarvsamlingar utan att behöva leta via vardera institutions egna tjänster. Även möjligheten att kunna se kulturarvet i ett större sammanhang för att kunna se samband och mellan samlingar världen över ses som en fördel. Deltagarna ser även att en av de främsta fördelarna är att institutionerna kan nå ut till en bred internationell användargrupp utan att själva behöva utveckla eller förvalta egna digitala tjänster eller infrastruktur.

Även möjligheten att ta del av kulturarvsinformation på ett strukturerat, standardiserat och maskinläsbart sätt – oavsett vilka standarder och system de enskilda institutionerna använder – samt möjligheten att använda och forska på kulturarvsinformation utifrån tematiska ingångar utan att behöva veta vilka samlingar som finns på olika institutioner, därtill möjligheten för användare och specialister utanför institutionerna att bidra till och berika kulturarvsinformationen, ses av majoriteten av deltagarna som främsta fördelar. Ingen av de som svarade ansåg att det inte fanns några fördelar med sammanlänkat kulturarv via Wikidata.

Projektet har producerat ett antal visualiseringar för att ge exempel på vad man kan göra med öppna sammanlänkade kulturarvsdatamängder och vilka frågor man kan få svar på. Vilka anser du skulle vara de fem främsta fördelarna med ett sammanlänkat kulturarv via Wikidata?

Välj högst 5 alternativ.

  • Möjligheten att hitta information om företeelser i olika kulturarvssamlingar utan att leta i de olika institutionernas egna tjänster. (18)
  • Möjligheten att se kulturarvet i ett större sammanhang och analysera samband mellan företeelser och föremål ur olika samlingar världen över. (16)
  • Möjligheten att ta del av kulturarvsinformation på ett strukturerat, standardiserat och maskinläsbart sätt – oavsett vilka standarder och system de enskilda institutionerna använder. (14)
  • Möjligheten att använda ett vedertaget frågespråk som SPARQL för att ställa frågor till kulturarvsdatamängder oavsett vilka sökfunktioner institutionerna har i sina respektive system. (5)
  • Möjligheten att använda och forska på kulturarvsinformation utifrån tematiska ingångar som personer, platser och händelser utan att behöva veta vilka samlingar som finns på olika institutioner. (14)
  • Möjligheten för användare och specialister utanför institutionerna att bidra till och berika kulturarvsinformationen. (14)
  • Möjligheten att som kulturarvsinstitution kunna nå ut med sin data till en bred internationell användargrupp utan att själv behöva utveckla eller förvalta en digital tjänst eller infrastruktur. (17)
  • Möjligheten till flerspråkighet. (9)
  • Möjligheten att använda den stora bank av applikationer och verktyg i öppen källkod som kan hantera data från Wikidata. (3)
  • Anser inte att det finns några fördelar. (0)
  • Andra fördelar, fritextsvar: (3)

  • ”Kvalitetshöjning av information på Wikidata”
  • ”Vill egentligen välja alla alternativ, möjligheterna är många!”
  • ”Vet ej om det är möjligt, men kanske möjligheten att hantera data oberoende av kulturell bias (t.ex. kristet/muslimskt kulturarv)”

Värdet för forskning om kulturarvssamlingar

Alla de svarande anser att sammanlänkning av kulturarvsinformation på nätet har en positiv inverkan på forskning om kulturarvssamlingar. Dock har de flesta av de svarande inte själva använt sig av sammanlänkade kulturarvsdata för forskning, vissa för att de inte ägnar sig åt forskning. Andra svarande upplever avsaknaden av sammanlänkade kulturarvsdata när forskning görs eftersom det skapar svårigheter och är mycket tidsödande att behöva leta i flera källor samt lista ut vem som är vem i personauktoritetslistor.

Tyvärr nådde inte enkäten så många forskare, vilket kan antas påverka resultatet.

En svarare beskriver att avsaknaden av sammanlänkade kulturarvsdata eventuellt kan vara en bidragande faktor till ”blind-spots” i forskningen till följd av att det material som är tillgängligt är det man redan forskar på. Utifrån det resonemanget skulle man kunna anta att avsaknad av sammanlänkade kulturarvsdata hindrar möjligheten till nya forskningsteman och metoder.

Anser du att ett ökat sammanlänkande av kulturarvsinformation på internet skulle ha en positiv inverkan på forskning om kulturarvssamlingar?

Endast ett svarsalternativ möjligt.

  • Ja (25)
  • Nej (0)
  • Vet inte/vill inte svara (0)

Har du exempel på fall där sammanlänkning av auktoritetsdata, mellan institutioner, har möjliggjort (din) forskning?
  • ”Jag har inte använt Wikidata som källa för information.”
  • ”Nej”
  • ”Alltför få.”
  • ”Jag har använt Wikidata mycket för att söka efter mer information om personer som antingen redan finns i vår museidatabas eller som jag vill lägga till. Att ha auktoriteter samlade på ett ställe har gjort det smidigt att hitta information och se att den person vi har i vår databas är samma som finns hos andra institutioner.”
  • ”Nej.”
  • ”Forskar inte själv, men har vid ett par tillfällen hört mycket intressanta berättelser i poddar som framförallt har handlat om ekonomisk historia. I åtminstone ett av dessa fall hade forskaren använt sig av data från en lång rad kulturinstitutioner och på väldigt kort tid kommit fram till flera intressanta frågeställningar (och en del svar).”
  • ”Ja. Digitalt museum.”
Har du exempel på fall där avsaknad av sammanlänkade auktoritetsdata, mellan institutioner, har varit ett hinder för (din) forskning?
  • ”Jag har inte använt Wikidata som källa för information.”
  • ”Varje gång jag letar efter information...”
  • ”Nej”
  • ”Jag bedömer att kulturarvsforskning ofta utgår ifrån det tillgängliga källmaterialet och att frågeställningarna därför ställs baserat på en mer traditionell infallsvinkel som inte kräver sammanlänkade auktoritetsdata mellan institutionerna. Därför blir det inte ett hinder utan snarare en "blind spot".”
  • ”Det tar längre tid att söka fram relevant information och vart man kan hitta den. Har personer liknande namn kan det vara svårt att avgöra vem som är vem och om den person vi har är samma som finns i en annan databas.”
  • ”Nej.”
  • ”Kan inte svara på det, men det förefaller rimligt att så är fallet i väldigt många fall.”
  • ”Ja”

Hinder för sammanlänkade kulturarvsdata

Hinder för kulturarvsinstitutionerna

Eftersom projektet Användbara auktoriteter för datadriven samlingsforskning fokuserat på att undersöka Wikidata som växel för sammanlänkade kulturarvsauktoriteter frågade vi de svarande om de ser något hinder för kulturarvsinstitutioner att arbeta med länkade öppna data via just Wikidata. De svarande fick kryssa i så många alternativ de ville, samt skriva svar i fritext.

Över hälften av alla som svarade på enkäten ansåg att de hinder som finns för kulturarvsinstitutioner i allmänhet att arbeta med länkade data via Wikidata är att det inte finns rätt kompetens på institutionerna, att arbete med länkade data inte prioriteras eller att institutionerna inte ännu kommit tillräckligt långt i sin digitala transformation för att vara redo att arbeta med länkade öppna data. Andra hinder för kulturarvsinstitutionerna att arbeta med länkade öppna data via Wikidata som deltagarna nämner är ekonomiska resurser, tid, ideologiskt motstånd, viljan till kontroll över publicerade data samt avsaknad av standardiserade arbetssätt för komplexa data. Endast tre deltagare ser inga hinder för kulturarvsinstitutioner att idag arbeta med länkade öppna data via Wikidata.

Projektet har använt sig av det kostnadsfria verktyget OpenRefine för att bearbeta och matcha kulturarvsdatamängder till Wikidata, där det också är kostnadsfritt att publicera data. Ser du några hinder för kulturarvsinstitutioner i allmänhet att arbeta med länkade öppna data via Wikidata?

Kryssa i ett eller flera alternativ.

  • Det finns inte rätt kompetens på kulturarvsinstitutionen. (13)
  • Arbete med sammanlänkning av kulturarvsdata prioriteras inte på kulturarvsinstitutionen. (15)
  • Kulturarvsinstitutionen arbetar med länkade öppna data på annan/andra plattformar (ej Wikidata). (9)
  • Kulturarvsinstitutionen har inte kommit tillräckligt långt i sin digitala transformation för att vara redo att arbeta med länkade öppna data. (14)
  • Kulturarvsinstitutionen har inte några publicerade dataposter (t ex länkar till poster i Sök i samlingarna/K-samsök/Digitalt museum eller liknande) på internet och kan därför inte koppla något till Wikidata. (5)
  • Kulturarvsinstitutionen vill ha kontroll över allt de publicerar och kan därför inte använda öppna plattformar som Wikidata där vem som helst kan redigera informationen. (7)
  • Ser inga hinder. (3)
  • Annat hinder, fritextsvar: (7)

  • ”Egentligen inga hinder mer än tid och kompetens.”
  • ”Kapacitet/Ekonomiska resurser saknas för ett arbete som inte förväntas ge direkt effekt på besökssiffrorna (som är vad huvudmannen först & oftast frågar efter)”
  • ”Jag tror att alla alternativ är korrekta, troligen inte alla samtidigt på en och samma institution utan att det beror väldigt mycket på var man befinner sig i en slags digital transformation.”
  • ”Jag kan tänka mig att mindre organisationer har svårt att avsätta personal/tid för att arbeta med länkad öppen data. I vissa mycket konservativa delar av en organisation kan det också finnas ett ideologiskt motstånd som mest är länkat till folkförakt.”
  • ”Även om det redan nu finns god kompetens inom organisationen bör vi öka kunskapen kring detta. Exakt hur det ska gå till kan jag inte svara på, men jag tror att frågan bör aktualiseras löpande. En större satsning på intern utbildning, eller åtminstone uppmaning till medarbetarna att ta del av den information som finns redan nu. En pedagogisk utgångspunkt kunde vara att prata lite mer om varför detta är viktigt, alltså skifta lite fokus från utförande och teknik till vilka mål vi strävar efter.”
  • ”Den data man hanterar för komplex för att tillgängliggöra, t.ex. finns inte standardiserade sökord för etiskt komplext material.”
  • ”Pengar”

Hinder för användarna/forskarna

Mer än hälften av alla som svarat på enkäten ser att forskare och andra användares brist på kompetens för frågespråket SPARQL är ett hinder för att de ska kunna använda kulturarvsdata på Wikidata. Även att forskare och andra användare inte har vetskap om att dessa datamängder finns på Wikidata lyfts av mer än hälften av deltagarna som ett hinder för användandet av kulturarvsdata via Wikidata.

I fritextsvaren anges brist på know-how, kvalitativ research som utgångspunkt i stället för kvantitativ, och att andra verktyg än SPARQL skulle kunna minimera behovet av kunskap i SPARQL (ex.v. AI), samt att mer inspiration till möjlig användning behövs.

Projektet har använt sig av Wikidatas egen sök- och frågetjänst för att söka i och analysera den data från Nationalmuseum och Statens historiska museer som tillgängliggjorts på Wikidata. Detta gör det möjligt att söka i de båda institutionernas datamängder utan att behöva använda de enskilda museernas system. Wikidatas frågetjänst använder frågespråket SPARQL. Ser du några hinder för forskare och andra användare att ta del av och använda kulturarvsdata via Wikidata?

Kryssa i ett eller flera alternativ.

  • Forskare/användare har inte kompetensen att ställa frågor till datamängder med hjälp av SPARQL. (16)
  • Forskare/användare känner inte till Wikidata som en möjlig ingång till kulturarvsdata. (15)
  • Forskare/användare använder andra plattformar för att hitta kulturarvsdatamängder. (8)
  • Forskare/användare är inte intresserade av att arbeta datadrivet med kulturarv. (3)
  • Ser inga hinder. (6)
  • Annat hinder, fritextsvar: (6)

  • ”Ser inget hinder men självklart behöver användare känna till hur man gör och det gör inte alla.”
  • ”Forskare/användare har många olika behov & profiler. Givetvis finns det somliga som är väl införstådda med kvantitativ metod & digital humaniora - men andra (humanister) står främmande för koncepten. De behöver hjälp att upptäcka hur de kan dra nytta av ny metod, & inse att kvantitativ metod inte är EMOT kvalitativ.”
  • ”Det finns troligen andra modernare verktyg för att uppnå samma insikter som användningen av SPARQL kan ge, typ Generativ AI, vilket skulle ta bort behovet av kompetens i ett frågespråk.”
  • ”Även här upplever jag att alla är korrekta och att insatser behövs på flera olika områden. "Even if you build it, they will not come" om vi inte också arbetar proaktivt med inspiration.”
  • “Jag kan för lite om vilka strategier som används inom kulturarvsforskning för att kunna uttala mig. Möjligen kan det i vissa fall vara så att stödet från handledare till yngre forskare ännu inte är bra nog. En äldre forskargeneration har möjligtvis inte tillräcklig kompetens? Det är hursomhelst en ren killgissning från min sida, och sannolikt har vi andra kollegor som är bättre skickade att säga något om detta.”
  • ”Vet ej”

Slutord

25 svarande är inte en särskilt stor grupp, trots detta kan vi se tendenser i enkätsvaren. Svaren visar att intresset för att arbeta med länkade kulturarvsdata är stort och att många redan har en förförståelse för Wikimedia-plattformarna.

Projektet Användbara auktoriteter för datadriven samlingsforskning kan fungera som ett exempel på att det inte krävdes särskilt stora resurser i vare sig tid eller pengar för att ta stora steg framåt i arbetet med länkade data för de båda medverkande institutionerna. En stor del av arbetet i projektet genomfördes också av kompetenser som vanligtvis redan finns på museer, med stöd och kompetensutveckling från Wikimedia Sverige.

Har du några andra kommentarer kring projektet, länkade öppna kulturarvsdata, Wikidata eller datadriven kulturarvsforskning?
  • ”Bra jobbat!”
  • ”Har inte riktigt fått grepp hur man kan använda Wikidata för arkeologiska samlingar och arkeologisk information.”
  • ”Jättebra projekt!”
  • ”Den förbättrade hitt-barheten är en kanske banal bieffekt av arbetet, som är till nytta för väldigt många.”
  • ”Ett viktigt och bra projekt som visar på möjligheterna med automatiserade arbetsflöden, något jag bedömer kommer att bli en grundbult i de närmsta årens digitaliseringsarbete.”
  • ”Jag tycker det är otroligt positivt att länka samman data på det sätt som kan göras via Wikidata. Det gör informationen mer lättillgänglig och tröskeln blir inte lika hög för användare att bidra med sin kunskap. Även för institutionerna blir det en låg tröskel gällande att göra sin data offentlig. Även om man har lite information om en viss företeelse kan denna berikas av allmänhet eller andra verksamma inom sektorn. Så jag ser det som en fördel för både allmänhet, forskare och yrkesverksamma att dela informationen på ett ställe, istället för att den ska finnas spridd över olika plattformar.”
  • ”Nej, inte just nu, men jag finner ämnet intressant och hoppas att vi får höra mer framöver.”