Projekt:Strategisk inkludering av biblioteksdata på Wikidata 2018/Källor på Wikipedia
Källor på svenskspråkiga Wikipedia
Inom projektet Strategisk inkludering av biblioteksdata på Wikidata har vi undersökt hur olika sorters källor används på svenskspråkiga Wikipedia. Målet var att identifiera de vanligaste källorna som underlag till en diskussion om hur samarbetet med Kungliga Biblioteket skulle kunna hjälpa wikipedianerna i deras arbete. För att få en nyanserad insikt i den stora variation av såväl källtyper som sätt att använda dem (källmallar, speciella mallar) har vi anförskaffat samt undersökt flera olika dataset.
Datorkoden som har använts för analysen finns tillgänlig som öppen källkod.
Böcker med ISBN
Material
En databasdump från 2018-03-01 som innehåller alla ISBN-försedda referenser på svenskspråkiga Wikipedia: https://figshare.com/articles/Wikipedia_Scholarly_Article_Citations/1299540
Metod
En frekvenslista över ISBN-numren skapades. Därefter gjordes ett försök att hämta verkens bibliografiska uppgifter från Libris medelst dess API.
Resultat
Listan domineras av uppslagsverk om djur och växter som används i botskapade artiklar. Då dessa utgör en stor andel av artiklarna är det inte konstigt. Trots detta finns det många andra verk i top 50 som har använts av mänskliga skribenter – vi kan se att Wikipedianerna hyser ett stort intresse för Sveriges kyrkobyggnader, konstnärer, hundraser, opera och Andra Världskriget.
- Här kan du se de 50 mest använda källorna.
- Här kan du se hela frekvenslistan med bibliografiska uppgifter från Libris.
- Här kan du se endast ISBN-numren.
Alla fotnoter – böcker
Material
Alla förekomster av ref-taggar i artikelnamnrymden, harvestade 2018-08-01.
Metod
Alla förekomster av mallen {{Bokref}} i artikelnamnrymden.
Resultat
Den här frekvenslistan omfattar alla böcker som citerats med hjälp av mallen {{Bokref}}, oavsett om de har ett ISBN-nummer eller inte. Eftersom ISBN började användas på 1970-talet täcker detta urval även äldre böcker och är en intressant komplement till den tidigarenämnda undersökningen. Här kan vi se bland annat samtida biografiska källor som Sveriges befolkning och Sveriges dödbok; demografiska källor med uppgifter om Sveriges befolkning och flera band av Svensk uppslagsbok.
Alla fotnoter – webbplatser
Material
Alla förekomster av ref-taggar i artikelnamnrymden, harvestade 2018-08-01.
Metod
Alla URL:er i dumpen extraherades och normaliserades till domännamnen, varpå en frekvenslista över dessa skapades.
Resultat
Även här kan vi se dominansen av botskapade artiklar som har källbelagts med webbplatser som NASA Earth Observation (geografiska platser världen över), World Plants (växter) och Catalogue of Life (djur- och växtarter). Högt i toppen hamnar också Internet Archive, ett digitalt arkiv över webbsidor som hjälper oss skydda uppslagsverket mot länkröta. Svenskspråkiga Wikipedia innehåller inte mindre än drygt 100 000 länkar till arkiverade webbsidor. Andra adresser som utmärker sig på listan och som kan tänkas ha använts mest av mänskliga skribenter är svenskspråkiga tidningar och nyhetstjänster – Dagens Nyheter, Svenska Dagbladet, Sveriges Radio, Aftonbladet och Sveriges Television – samt det "konkurrerande" uppslagsverket Nationalencyklopedin.
- Här kan du se de 50 mest använda källorna.
- Här kan du se (nästan) hela frekvenslistan – dvs. domännamnen med minst 10 hits.
Runeberg.org
Material
Alla förekomster av mallen {{runeberg.org}} i artikelnamnrymden – både i fotnoter och som vanlig text.
Metod
En frekvenslista över mallens parametrar skapades. Notera att själva mallen inte innehåller någon information om bokens titel/författare – hur dessa visas för läsaren styrs av mallkoden.
Resultat
Den allra vanligaste Runebergskällan är utan tvekan Nordisk Familjebok, särskilt dess andra upplaga (Uggleupplagan) som publicerades mellan 1904 och 1926. Dess 38 volymer dominerar fullständigt listan. Det kommer inte som någon överraskning då det finns Kategori:Ugglan många artiklar på svenskspråkiga Wikipedia som baseras på detta uppslagsverk.
Bland andra vanliga källor kan vi hitta olika upplagor av det biografiska uppslagsverket Vem är det som i decennier gett oss information om kända svenskar, samt generalregistret till Svenskt Porträttgalleri, som även det innehåller biografiska uppgifter. Det enda icke-biografiska verket i top 50 är Bilder ur Nordens Flora som innehåller beskrivningar av drygt 650 växter.
Strategisk inkludering av biblioteksdata på Wikidata | |
---|---|
Internal | About the project · Slides and other material on Commons |
Reports | Report package in Swedish · Report in English |
Mappings (Libris to Wikidata) | Library data · Authority data |
Code | github:Vesihiisi/Biblioteksdata |