Hoppa till innehållet

Projekt:GLAM 2015/Ansökan till Jubileumsfonden

Från Wikimedia
Ansökan har avslagits.
Svar ges under maj månad

Här skriver vi på vår ansökan till Riksbankens Jubileumsfond för digitalisering av Skoklosters slotts boksamlingar.

Anvisningar och ansökningsförfarande - från anvisningarna

"Av ansökan ska involverade minnesinstitution(er) och lärosäte(n) tydligt framgå liksom projektledarens meriter och kontaktuppgifter. Den ska därutöver innehålla en projektbeskrivning och budget enligt följande:

Projektbeskrivningen (maximalt 15 000 tecken inklusive blanksteg) ska innehålla

  • tydliga frågeställningar och/eller hypoteser, projektets relation till rådande förhållanden och andra liknande projekt inklusive vilka behov som de förväntade resultaten kan tillgodose
  • distinkt beskrivning av de teoretiska och metodiska frågor som projektet aktualiserar, redogörelse för i vilka avseenden den valda inriktningen är originell och nyskapande, dess relevans för forskningen och/eller minnesinstitutionen samt dess genomförbarhet
  • detaljerad specifikation och motivering för resursbehov (löner och drift). Den beräknade tidsåtgången ska beskrivas noggrant. Nuvarande anställningsförhållanden för all personal ska redovisas. De medverkandes funktion i projektet samt relevanta kompetenser och meriter ska beskrivas, inklusive de synergieffekter som gruppens sammansättning förväntas ge
  • redovisning av medfinansiering i form exempelvis av pengar, arbetstid eller utrustning
  • specificering av internationella kontakter till exempel i form av en avsiktsförklaring från deltagarna
  • en plan för hur de nya resurser för forskning och minnesinstitutioner som projektet förväntas ge upphov långsiktigt ska förvaltas och vidareutvecklas
  • publikationsplan och annan motsvarande redovisning av hur resultaten ska göras kända för olika brukare och en intresserad allmänhet."

Sammanfattning på svenska

Syftet med projektet är att genom arbetet med digitalisering av boksamlingen på Skoklosters slott (hädanefter SKO) få lärdom om de nödvändiga processerna, som sedan kan komma andra minnesinstitutioner till gagn. Samlingen på 19 000 verk innehåller ett stort antal unika böcker, insamlade under århundraden. Samlingen är katalogiserad men ännu inte digitaliserad i fulltext och mycket få kan komma åt materialet, trots betydelsen för forskare och allmänhet i många länder. Beslut om digitalisering har tagits men arbetet har inte påbörjats. Det finns därför möjlighet att följa och studera arbetet från början. Undersökningen gäller hela processen, från metodologisk utveckling för digitalisering till förädling och spridning av materialet genom flera plattformar. Digitalisering kan endast ske under sommaren varför projektet av nödvändighet pågår under 5 år.

Sammanfattning på engelska

The aim of the project is to digitize the Skokloster Castle book collection and from that work draw lessons about the processes that can benefit many other memory institutions. The collection contains a wealth of unique books, collected over the centuries. These are not yet digitized and few people can access the material. This is unfortunate, since the library contains material that is important to researchers and public world wide. A decision has been made to digitize, but the work has not yet started, thus it would be possible to monitor and study the work from the very beginning. The investigation will cover the process as a whole, from methodical development for digitization to refining and dissemination of the material through multiple platforms. Digitization can only take place during the summer hence necessity demands that the project goes on for 5 years.

Boksamlingarna på SKO

SKOs boksamling består av 18 987 böcker från 1400- till 1800-tal. Böckerna köptes, var gåvor eller togs som krigsbyten. Ämnen och språk är därför mycket varierade och det digitaliserade materialet kommer mängder av forskare i olika länder till nytta när det tillgängliggjorts online, framförallt då en del av materialet är unikt. Biblioteket är ouppvärmt och samlingen hanteras eller flyttas inte under vinterhalvåret pga. materialets skörhet. På sommaren kan den bearbetas på plats. Enskilda böcker flyttas enbart i undantagsfall.

Boksamlingen är katalogiserad och RJs generösa stöd gjorde att katalogen kunde tillgängliggöras online på flera plattformar för att komma allmänheten till del. Ett samarbete med Kungliga biblioteket (KB) ledde till djupare info om böckerna. En god grund finns därför för fortsatt digitalisering.

Best-practice för digitalisering och digitalt tillgängliggörande

Digitalisering av vårt kulturarv gör tidigare svårtillgänglig information sökbar och enkel att komma åt online. Detta är en demokratifråga och bidrar till det långsiktiga bevarandet av ömtåligt kulturarv. Enorma möjligheter öppnas för nya innovativa tjänster och företagande då material kan kopplas samman med andra samlingar och nya slutsatser kan dras. Utförlig metadata och transkribering är dock centralt för användbarhetens säkerställande.

Tusentals museisamlingar, såväl som olika privata samlingar, väntar på att digitaliseras i Sverige. Unika och värdefulla böcker är extra svåra att digitalisera och riskerna större. Det arbete med bokskanningsrobotar som bla. KB utvecklat kan inte användas på känsliga böcker. För dessa finns andra metoder, men effektiva arbetsflöden saknas. Genom samarbetet med KB kommer dessa kunskaper att inhämtas och onödiga misstag kan därför undvikas och verkligt nya erfarenheter skapas. Digitaliserat material kan sedan spridas på olika plattformar (med olika förutsättningar) för att nå ut till olika grupper.

Trots att stora summor varje år läggs på digitalisering av kulturarvet finns det ett stort behov av att identifiera best-practices, möjligheter med crowdsourcing samt vilken kvalitet och struktur materialet skall ha för att det ska få ett mervärde och hur det kan spridas. Teknikutvecklingens hastighet gör att några år gammal forskning redan till stora delar är föråldrad. Processerna är dåligt dokumenterade och undersökta och det saknas en vetenskaplig analys. Om stödjande material finns för kommande projekt kan enorma summor sparas.

Forskningen

Projektet kommer resultera i forskningsrapporter med rekommendationer för hur man digitaliserar boksamlingar. Dessa utreder två, för minnesinstitutionernas fortsatta digitaliseringsarbete, kritiska frågor: (1) metodologisk utveckling för digitalisering samt (2) förädling och spridning av materialet.

1) SKOs digitaliseringsarbete utgör ett idealiskt studieobjekt för ökad förståelse kring organisation av digitaliseringsarbete. Digitalisering av samhället är ett av informatiks huvudsakliga studieobjekt och att följa detta projekt från start innebär stora möjligheter för kunskapsutveckling kring detta fenomen. Det bidrar även till ökad insikt i best-practice, inte bara gällande själva digitaliseringsprocessen, utan kring de behov och konsekvenser som användare av resultatet upplever. Slutsatserna blir generaliserbara till andra samlingar inom och utanför Sverige. UmU, i samarbete med SKO, undersöker dessa frågor genom ett kvalitativt angreppssätt (exv. intervjuer, workshops och observationer). Svar som genereras presenteras i lämpliga tidskrifter och/eller konferenser.

2) Den semantiska webben och den potential crowdsourcing skapat ger nya möjligheter som undersöks i detalj. Vilka plattformar bör användas, vilka behov uppfyller de och vilka ger bäst spridning och varför? Hur förmedlas digitaliserat material, hur skapas intresse för det och hur säkerställs dess användning?

Projektet samarbetar med WMSE som verkar för fri kunskap bland annat genom Wikipedia och Wikisource, där många institutioner redan publicerat digitaliserade originaltexter. Wikisource kan lagra "källor" som originalmanuskript, böcker eller andra verk och där kan experter och allmänhet transkribera texter. Materialet på SKO är en språklig och tematisk mix och många olika grupper från olika länder behöver engageras för att transkribera texterna. Wikisource erbjuder flerspråkigheten. Hur kan Wikisource utvecklas för att möta dessa globala behov av att överbrygga språkbarriärer? Hur kan transkriberingen bäst struktureras och praktiskt genomföras? Hur engageras olika grupper att bidra? Ett flertal olika aktiviteter för att engagera personer att bidra kommer anordnas och deras effekter att utvärderas och analyseras.

Vidare avser projektet testa hel- eller delautomatiska tekniker för att tillgängliggöra och förädla SKOs textmaterial för forskning (t.ex. optisk teckentolkningen eller via lingvistisk information); bland annat via teknik utvecklad inom Språkbankens projekt: MAÞiR, KOALA och SWE-CLARIN. Det värdefulla SKO-arkivets textinnehåll blir tillgängligt för forskare inom olika discipliner, som lingvister, historiker och litteraturvetare. Språkbankens språkteknologiska verktyg testas och förfinas på detta material och nya sökmöjligheter blir tillgängliga.

Tidplan

Projektets intensitet kommer att variera då digitalisering av böckerna endast kan ske sommartid. Då samlingen är omfattande och variationsrik beräknar vi projektperioden till fem år. Under varje period av digitalisering läggs fokus på olika typobjekt vartefter erfarenheter analyseras och utvärderas. Baserat på dessa insikter sker kontinuerlig utveckling av processen.

Sep 2015-maj 2016: Olika aktörers behov kring digitaliseringen identifieras gällande skanningskvalitet etc. Dessa behov avgör antalet verk som kan skannas under projektet. WMSE identifierar behov av förberedelse på Wikisource samt förbereder onlinepublicering av data.

Maj-sep 2016: Provdigitalisering med olika tekniker samt utvärdering av dessa.

Under sommarperioderna sker massdigitaliseringen och fortsatt analys av detta.

Under vintrarna genomför forskare analys och sammanställning av resultat bl.a. avseende hur minnesinstitutioner ska metadatasätta och namnge filer samt arkivera och förädla innehållet t.ex. lingvistiskt. Vidare utreds möjligheterna att förbättra sökmöjligheter (via exv. Språkbankens Korp-system) och utvärdera plattformar för publicering. WMSE introducerar personal från minnesinstitutioner och volontärer till arbetet med transkribering.

Maj-aug 2020 avrundas projektet och rapportering färdigställs.

Förvaltning och spridning av materialet

Projektet resulterar i en forskningsrapport som diskuterar ett antal olika vägval inom digitaliseringsprocessen. I den kommer vi att förklara vilka vägval vi har gjort och ge rekommendationer till framtida digitaliseringsprojekt. Målet är att samtliga institutioner som ska digitalisera boksamlingar ska ha nytta av rapporten. Projektet ska ange standarden för digitalisering av boksamlingar. I det andra delprojektet kommer analysen att gälla tillgängliggörande och förädling av materialet. Resultatet från arbetet kommer att spridas på passande konferenser och evenemang i Sverige och utomlands. Rapporten kommer att vara fritt licensierad.

UmU kommer även att publicera material i ämnesrelaterade tidskrifter och/eller konferenser. Allt publicerat material tillgängliggörs genom Open Access och fria licenser.

Metadata rörande de digitaliserade böckerna kommer att tillgängliggöras via ett flertal plattformar (under CC0). Genom Wikisource kommer det även att finnas en extra kopia av det digitaliserade materialet (inkl. bilderna) för att säkerställa dess bevarande. Materialet har utgången upphovsrätt och kommer därför att kunna återanvändas av alla som har intresse av det, utan kostnad. WMSE och SKO kommer gemensamt att arbeta med denna punkt.

Kontinuerligt kommer projektparterna, under ledning av WMSE, aktivt sprida information om projektet på sociala medier, på bloggar samt genom pressreleaser m.m. En kommunikationsplan kommer att upprättas i projektets början för att koordinera insatserna mellan deltagarna.

Kompetens och kvalifikationer hos de sökande

Projektgruppen samlar en unik konstellation med kompletterande expertis avseende boksamlingen, digitaliseringsprocesser och tillgängliggörande av informationsmängder.

Livrustkammaren och SKO med Stiftelsen Hallwylska museet (LSH) är en statlig myndighet för bevarande och spridning av vårt kulturarv. LSH arbetar under 2014 med bas i en digitaliseringsstrategi med fokus på arbetsprocesser och rutiner för fotografering, katalogisering, metadatasättning samt arkivering. Under året erhöll man guld i kategorin Open på American Allliance of Museums stora prisgala MUSE award för sitt tillgängliggörande av digitala samlingar. Projektet leds av Karin Nilsson, enhetschef för Digitala museet på LSH, specialiserad på digitalisering av kulturarv med fokus på arbetsprocesser, semantisk webb och informationsstruktur, bla. på Riksantikvarieämbetet. Hon sitter också med i Centralmuseernas digitaliseringsgrupp, ledde under 2014 en grupp för K-samsöks utveckling och ingår i ett flertal av Digisams arbetsgrupper. Från LSH deltar även myndighetens intendent, papperskonservator, fotograf samt personal på SKO.

WMSE är den svenska grenen av Wikimedia-rörelsen (som bla. driver Wikipedia). Föreningens expertis rör digital spridning, organisering av volontärer och crowdsourcing. WMSE är den organisation i Sverige som har expertis kring plattformen Wikisource och har även ett flerårigt samarbete med Centralmuseernas samarbetsråd, Europeana mfl. WMSE har lett flera stora massuppladdningar av digitaliserat material.

Institutioner för informatik på UmU har under de senaste 15 åren bedrivit forskning om samhällets digitalisering och de processer som omger detta. Arbetet på UmU leds av professor Mikael Wiberg och hans team. UmU är en stark projektpartner för att projektet ska kunna förena praktisk nytta med hög vetenskaplig nivå vad avser forskningsfrågor, vetenskaplig metodik och internationell publicering och spridning av projektets resultat.

KB är en ledande institutionen för bokdigitalisering. Utvecklingen leds av fd bevarandechefen Lars Björk som sedan 2010 är professionsdoktorand vid Institutionen för biblioteks- och informationsvetenskap vid Borås högskola med ett forskningsfokus kring digitaliseringens teori och praktik. Han är programansvarig för digitalisering på KB. I projektet deltar även Peter Krantz, CIO på KB och expert på öppna data och semantisk webb. KB:s bidrag till projektet är dels det kunskapsunderlag som redan finns utarbetat för digitalisering, men även för att aktivt bidra till utveckling av best-practice inom såväl digitalisering av boksamlingen som av spridningen av densamma.

Språkbanken på Göteborgs universitet (GU) är en nationellt och int. erkänd forskningsenhet, med unik kompetens kring bla. svenska textkorpusar och elektroniska lexikonresurser samt språkteknologiska verktyg för att bearbeta, annotera och visa upp textkorpusar. Materialet i Språkbanken avspeglar hela den skrivna svenskans historia med alla dess genrer. De används flitigt av forskare i och utanför Sverige, både i empirisk forskning och i undervisning. Även allmänheten använder dem då huvuddelen av resurserna är fritt åtkomliga för sökning via webbaserade sökgränssnitt.

Förtydligande av budget

Den största delen av kostnaden består av arbetstid. Denna kommer att variera över året beroende på möjliga arbetsuppgifter.

Projektmedlemmar från LSH (30% egenfinansiering (EF)):

  • Projektledare: Karin Nilsson, enhetschef Digitala museet.
  • Erik Lernestål, fotograf, ansvarig för teknisk utveckling.
  • Ann Hallström, konservator, ansvarig för bevarandet av boksamlingen.
  • Monica Sargren, intendent, ansvarig för boksamlingens innehåll.
  • Gösta Sandell, biträdande museichef SKO, platsansvarig.
  • Två personer anställs för digitaliseringen.

Från UmU (50% EF):

  • Mikael Wiberg, professor, institutionen för Informatik.
  • Rikard Harr, lektor, institutionen för Informatik.
  • En doktorand anställs.

Från WMSE (30% EF):

  • Axel Pettersson, projektledare, ansvarig för användandet av Wikisource.
  • André Costa, utvecklare, ansvarig för massuppladdning av bilder.

Från GU (Språkbanken) (20% EF):

  • Dimitrios Kokkinakis, docent i språkteknologi, ansvarig för textförädling, dvs. lingvistisk analys av den svenska texten.

Inhyrning och därefter införskaffande av olika typer av utrustning för att identifiera lämpliga högkvalitativa skanners som klarar förhållandena på SKO (med kyla m.m.) beräknas kosta ca 1 MSEK. Denna kostnad är baserad på de samtal vi fört med KB om priser för olika typer av skanners och OCR-programvara samt en schablon för anpassning till miljön på slottet.

Därtill kommer resor, varav huvuddelen är för UmUs och GUs forskare för att de ska kunna undersöka digitaliseringsarbetet på plats på SKO, samt en del för WMSE för att hålla utbildningsevenemang runt Wikisource samt delta på arbetsmöten. För KB och LSH handlar det om spridning av erfarenheter.

Budget

"Budgeten ska innehålla

  • en förteckning över all medverkande personal med angivande av namn, månadslön, sociala avgifter (lkp) och arbetstiden uttryckt dels i form av procent av heltidsanställning, dels antalet månader anställningen ska pågå. OBS! Kostnaden för de deltagare som inte ska avlönas inom det sökta anslaget utan av medverkande minnesinstitutioner, universitet och högskolor eller liknande anges som 0 kronor
  • en redovisning av driftskostnader, kostnader för resor, konferenser, publicering och liknande med tydliga motiveringar
  • en redovisning av medfinansieringen, antingen i form av pengar eller med arbetstid, utrustning eller liknande. Finansiärerna godtar inte medfinansiering i form av beräknade kostnader för så kallad overhead (OH), indirekta kostnader eller lokalkostnader.

Till varje projektanslag beviljar Vitterhetsakademien och RJ ett bidrag till indirekta kostnader och lokalkostnader i enlighet med de principer som gäller för övriga anslag från finansiärerna."