Hoppa till innehållet

Projekt:DCAT-AP för Wikibase och Wikidata 2015/Slutrapport

Från Wikimedia

Projektresultat för Vinnovas bedömning

Projektsammanfattning - Utfall

Vi anser att projektet varit framgångsrikt då en DCAT-AP-beskrivning byggd på ett flexibelt ramverk nu är driftsatt på Wikidatas servrar. Lösningen kan med minimala förändringar användas för andra projekt som bygger på Wikibase-plattformen.

Den slutliga lösningen innebär att koden inte ligger direkt i Wikibase-mjukvaran utan istället är tillgänglig som en separat insticksmodul. Denna finns i sin tur beskriven på och länkad till från Wikiba.se, Wikibase-mjukvarans officiella webbplats. I Wikidatas fall har modulen även integrerats direkt i produktionsflödet.

Vi tror att användning av DCAT-AP-beskrivning för Wikidata kommer att öka i takt med att fler översättningar kommer in och driftsätts (idag finns översättningar på 20 språk). En vidare inbjudan har gått ut till Wikidata-gemenskapen för att koordinera detta samt för introducera gemenskapen till projektet.

Tidsplanen blev försenad på grund av den kodgranskning som krävs innan lösningen kunde integreras i Wikidata. Det rådde osäkerhet kring vems ansvarsområde (Wikidata/WMF) detta föll under och därigenom vem som kunde ge klartecken för driftsättning.

Dessa förseningar, samt projektets tekniska natur, har tyvärr negativt påverkat våra möjligheter att aktivt kunna kommunicera ut resultatet. Att den självklara slutkonsumenten, öppnadata.se, varit stängt för nya dataset har gjort det svårare att visa projektet för det svenska öppna data-gemenskapen samt en bredare allmänhet.

1244/1500 tecken

Mål för projektet - uppfyllelse

  • Skapa själva DCAT-AP-beskrivningen:
    • Vi skapade en generaliserad mall genom vilken en DCAT-AP-beskrivning dynamiskt kan genereras utifrån existerande filer och angivna parametrar. På så sätt kan beskrivningen automatiskt genereras utan behov av handpåläggning. Detta gjorde det även möjligt att automatiskt integrera översättningar allt eftersom gemenskapen skapar dessa.
  • Implementera DCAT-AP i Wikidata:
    • Tillsammans med Wikidata och WMFs utvecklare driftsatte vi DCAT-AP-genereringen på servrarna för Wikidata. DCAT-AP-filen uppdateras veckovis i samband med dumpningen av Wikidata.
  • Generalisera processen för Wikibase:
    • Genom att bygga upp beskrivningen dynamiskt är det möjligt att fullt ut anpassa beskrivningen för den aktuella miljön. Det är därigenom möjligt att direkt återanvända mjukvaran för vilken Wikibase-installation som helst. Den enda anpassning som krävs är att man anger detaljerna för den nya miljön.
    • Vissa av komponenterna kan även användas för att skapa DCAT-AP-beskrivningar i andra öppna data projekt som regelbundet levererar statiska dumpar av sin data.
  • Kommunicera ut om denna förändring:
    • P.g.a. osäkerheten kring vem som ska driva öppnadata.se har projektresultatet inte kunnat göras tillgängligt på denna plattform. Därigenom har även den mest naturliga möjligheten för kommunikation om detta inom Sverige försenats. Information har dock gått ut under vissa event i vårt Kunskapsspridningsprojekt. Förseningarna av kodgranskningsarbetet samt projektets väldigt tekniska natur har även inneburit att full kommunikation om detta inom Wikimediasfären ännu inte varit möjligt. Efter projektslut har vi dock gått ut med information om den nya DCAT-AP-beskrivningen i Wikidatas nyhetsbrev.
1496/1500 tecken

Publik redovisning

Syfte och mål - uppfyllelse

Projektets syfte var att göra det möjligt att med DCAT-AP beskriva Wikidata samt att göra processen generell nog för att kunna återanvändas för andra plattformar som använder Wikibase. Vi anser att målet är väl uppnått då en DCAT-AP-beskrivning nu finns för Wikidata. Denna har integrerats så att den automatiskt genereras vid var uppdatering. Programvaran går även direkt att återanvända i vilken framtida Wikibase-installation som helst. Slutligen är lösningen helt internationaliserad så att DCAT-AP-informationen kan fås på önskat språk.

464/500 tecken

Resultat och förväntade effekter - utfall

Vi tror att användning av DCAT-AP-beskrivning för Wikidata kommer att öka i takt med att fler översättningar driftsätts (idag finns översättningar på 20 språk).

Det flexibla sätt genom vilken DCAT-AP-beskrivningen genereras gör det även troligt att det kommande CommonsData-projektet, länkad data till stöd för Wikimedia Commons 27 miljoner mediafiler, kommer att beskrivas med DCAT-AP.

Då modulen finns beskriven på wikiba.se är det även troligt att mindre projekt som använder Wikibase hittar och använda sig av denna lösning för att generera en flerspråkig DCAT-AP-beskrivning.

498/500 tecken

Upplägg och genomförande - analys

Projektet startade med en kartläggning av de datamängder relaterade till Wikidata som fanns tillgängliga följt av en analys av hur ett projekt av Wikidats natur bäst kunde beskrivas i DCAT-AP samt vad som var generiskt för alla Wikibase-installationer.

Lösningen byggdes så flexibelt som möjligt för att göra den lätt att återanvända i olika miljöer med olika förutsättningar/inställningar, ett krav för driftsättning hos på Wikidata.

Koden genomgick en längre period av itererad kodgranskning för att olika intressenterna inom WMF/Wikidata skulle kunna väga in om slutresultatet.

497/500 tecken

Syfte och mål - uppfyllelse - på engelska

The aim of the project was to make it possible to use DCAT-AP to describe Wikidata and make the process general enough to also be able applied to other platforms using Wikibase. We feel that this goal has been reached since there is now a DCAT-AP description for Wikidata. This has been integrated so as to be automatically generated after each update. The software can also be reused in any future Wikibase-installation. Finally the solution is fully localisable so that the DCAT-AP information can be had in any desired language.

442/500 tecken

Resultat och förväntade effekter - utfall - på engelska

We believe that the DCAT-AP description of Wikidata will see increased use as more translations are put into production (there are already translations in 20 languages).

The flexible way in which the DCAT-AP description is generated also makes it likely that the coming CommonsData project, linked data in support of the 27 million media files on Wikimedia Commons, will be described using DCAT-AP.

Since the module is described on wikiba.se it is also likely that smaller projects which use Wikibase will find it and make use of this solution for generating a multilingual DCAT-AP description.

500/500 tecken

Upplägg och genomförande - analys - på engelska

The project started by making an inventory of the available datasets related to Wikidata followed by an analysis of how a project of Wikidata's nature was best described in DCAT-AP and which parts were generic for any Wikibase installation.

The solution was built in as flexible a way as possible to make it easy to reuse in different environments with different conditions/settings, a requirement for deployment on Wikidata.

The code went through an extended period of iterative code review so that the various stakeholders within WMF/Wikidata could weigh in on the final result.

488/500 tecken