Jag vet inte om det är helt rätt forum, eller om vi får komma, men denna aktivitet från SKL skulle säkert leda till en del intressanta kontakter med framåttänkande personer. http://www.skl.se/kurser?pageID=e60dfa26-703b-4153-992c-c1290a95fa6c
Projektdiskussion:Öppen databas för offentlig konst 2013
- Under funderingar och diskussioner kring detta projektet har en del oklarheter kommit fram. Genom att ta upp dem här är det min förhoppning att feedback och kloka tankar ska kunna klara ut några av dessa.
Denna frågan gäller de unika id som är associerade med vart konstverk. Dessa kommer dels att användas internt av databasen och dels i listorna på wikipedia (för Wiki Loves Public Art). Där dessa id finns hos källan (dvs. kommunen) är det hela relativt oproblematiskt. Om vi är oroliga för att två kommuner använt samma id kan vi använda ett källspecifikt prefix internt i databasen. Däremot kan prefixet inte användas i listorna på wikipedia då detta faller under "egen forskning". Detta innebär i sin tur att det blir klumpigare att märka upp/ladda upp bilder men det borde gå att lösa.
Ett större problem uppstår om källan helt saknar id-nr. Databasen kräver ett id så vi blir tvungna att hitta på något men det råder inte längre någon tvekan om att det handlar om egen forskning. wikipeidalistorna skulle helt sakna ett (synligt) id och även inom den interna databasen är det oklart huruvida vi skulle vilja visa vårt "påhittade" id för omvärlden.
Sena har vi även frågan om hur vi ska hantera en situation där en kommun senare (efter originalimport) ändrar sitt id-system.
Här finns en WLM tråd om italiens id problem och här finns lärdomar från Tyskland för varför man inte ska använda egna id .
En tanke som skulle kunna lösa "presentera inte egna id för omvärlden" är att markera upp i databasen ifall källan angav id-nr eller inte. Ifall de inte gjorde det så visar man inget id utåt, annars visar man id minus prefix.
Detta löser dock inte situationen kring wikipedialistorna eller den mer principiella frågan kring att hitta på egna nummer.
Morus AB, med CC-projektledaren Jonas Öberg anställd, har också fått pengar från Vinnova för kompetensförstärkning kring kommunal öppna data. Det kanske är intressant att samarbeta med dom i det här projektet. På http://morus.se/2012/12/morus-hjalper-kommuner-med-oppna-data/ står det mer om deras projekt.
Det är ju utmärkt! Jonas kan ju då få ett konkret och aktuellt case att jobba med. Vilken win-win!
Jättebra idé Axel! Det vore ju jättebra om vi kan hänvisa en del av kommunernas frågor till dem.
Här är en sida med kontaktinformation till Jonas och två av hans medarbetare.
- Under funderingar och diskussioner kring detta projektet har en del oklarheter kommit fram. Genom att ta upp dem här är det min förhoppning att feedback och kloka tankar ska kunna klara ut några av dessa.
Här kommer en fråga av ett mer (lag)tekniskt slag. vad är en passande licens för vår databas? Hur påverkar en fri licens vilken data vi kan samla in från kommunerna (t.ex. beskrivningar)? Hur påverkar eventuell skörd av användargenererat material (se Input:UGC nedan) licensalternativen.
Creative Commons skriver lite om databaser och licenser här men om någon har en mer direkt erfaren så skulle det vara till stor nytta.
Mycket bra fråga. Man kan se det på olika sätt. Om vi ska ha data flöda fram och tillbaka från Wikipedia så blir ju den naturliga lösningen CC-BY-SA. Då slipper vi funderingar på kompabiliteter. Annars är det väl i det här fallet CC-0 som skulle kunna vara ett drastiskt alternativ, eller Open Database License (som är väldigt likt CC-BY-SA). Sammanfattningsvis lutar jag nog mot CC-BY-SA.
Bortsett från beskrivningsfältet så borde all information i databasen vara ren fakta och därmed inte skyddad av upphovsrätten (andra delar av databasen kan vi licensiera som vi vill). Så det är väll egentligen bara det fältet som ger oss ett problem. Om vi skördar detta fältet från kommunerna via PSI direktivet kan vi inte kräva att de släpper den infon fri. Skördar vi den från wiki så kan vi inte annat än ha den under CC-BY-SA-3.0. Jag vet inte till vilken del vi skulle kunna släppa databasrättigheterna separat från detta.
OK. har nu tittat på Vidareutnyttjande av handlingar – genomförande av PSI-direktivet (s.38 framåt) som verkar styrka att bruksrätten för officiella dokument står högre än både eventuellt katalogskydd och upphovsrätten för beskrivningar. Därmed borde det inte vara något licensproblem från kommunernas sida.
Jag skulle föreslå cc-by-sa-3.0 för innehållet (content) och ODbL för databasen. Det innebär att vi kan använda bidrag från Wikipedia (content) och att vem som helst kan använda databasen så länge de går med på ShareAlike. Alternativet är CC0 för databasen eller CC0 för allt men begränsa beskrivningsfältet till original (icke-wikipedia) material.
- Under funderingar och diskussioner kring detta projektet har en del oklarheter kommit fram. Genom att ta upp dem här är det min förhoppning att feedback och kloka tankar ska kunna klara ut några av dessa.
Denna förfrågan gäller hur wiki(media)centrisk vi vill att databasen ska vara. I dagsläget är den enda wikicentriska parametern som är spikad det att bilden måste ligga på Commons. Detta är relativt oproblematiskt då vi kräver fria bilder, import av bilder från andra källor är relativt lätt, Commons används redan idag av många aktörer utanför wikimedia.
Vi skulle lätt kunna lägga till fler wikicentriska parametrar som t.ex. artikel om konstverket, artikel om konstnären, commonskategori, artikel om kommunen etc. Frågan är, med tanke på att databasen även är tänkt att användas av övriga aktörer, hur relevant/passande dessa parametrar skulle vara. Vad gör exempelvis wikiartikeln om konstnären mer relevant än Statens konstråds artikel om den samma? Nu har jag ingen aning om de faktiskt har sådana artiklar men man kan säkert hitta exempel och möjligen även exempel under fria licenser.
Jag tror att det skulle vara en bra service att integrera artikel om konstverket, artikel om konstnären, commonskategori redan från början. Sedan skulle man kunna ha mer officiell data om det går, t.ex. VIAF (med länk?) eller liknande för konstnären. Och det vore inte helt fel att kunna ha en så officiell som möjligt vidare länk för verket också.
En tanke angående artikelnamn så tror jag att det är bra att redan nu använda entitetsnumret på wikidata istället för artikelnamnet.
OK. Har lagt till wikiartikel (preliminärt wikidata) för konstverket, Commonskategori samt officiell_url (om t.ex. kommunen har en websida per objekt). För konstnärerna är förhoppningen att bara ange namnet i objektposten och sedan länka till en separat konstnärstabell (som i sin tur kan innehålla wikiartikel/Creator-mall/dödsår/VIAF etc).
Angående wikidata eller artikelnamn så är det fortfarande inte klart hur persistenta deras id kommer att vara (de raderar exempelvis dubbletter snarare än att omdirigera dem). Vet inte heller om det går att länk direkt till sv.wiki via en wikidatalänk (typ d:Q7724) eller om detta kräver att man aktivt gräver fram iwlänken var gång.
Lägger du in både wp-artikel och wikidata-item så lägger du väl in redunanser? En enkel api-fråga till Wikidata svarar snabbt på vilket item som är kopplat till vilken artikel, på vilken wp-wiki som helst. Kopplingen till wikisar (tex Commons) som inte självklart kommer att ha en 1:1-relation till item's vet jag inte om det är helt utrett hur det kommer att fungera.
Jag var nog lite otydlig. Jag menade wikiartikel (preliminärt i formen av ett wikidataID). Att behöva göra en API förfrågan var gång man vill presentera en länk till svwikiartikeln är vad jag menade med att "gräva fram iwlänken" var gång. Vad jag hade hoppats på var att något i stil med https://www.wikidata.org/wiki/Q7724/svwiki automatiskt skulle länka till https://sv.wikipedia.org/wiki/August_Strindberg. Det kan hända att något sådant är på gång men då har jag missat det.
Men jag tror ändå att wikidaID+commonscat är det bästa att registrera i dagsläget. Om inte annat så för att wikidatamöjligheterna kommer att byggas ut senare.
Det vore smidigt!
Infon finns ju där, så...
The Public Catalogue Foundation har fotograferat alla oljemålningar i UK. Jag tänker att vi både kan plocka en hel del argument från dem varför de gjort det och även använda dem som ett positivt exempel på vad som är möjligt! Se:
Är detta för ÖDOK eller WLPA?
Jag letade runt på websidan men kunde inte hitta ett "Why we do it?" stycke. Vad jag hittade var "Benefits in Participation" som riktar sig mot artisterna. Från ÖDOKs vinkel är det ett väldigt bra exempel på vad man kan göra om man har bra grunddata och bilder.
Oavsett vilket så är det ett maffigt projekt. Kul att de dessutom vågade lägga det online.
Jag tänkte att det passar båda två.
Argumenten förs främst fram i Andrew Ellis intervju (den första länken).
Till ÖDOK kan vi påpeka att en svensk version av Public Catalogue Foundation (PCF) projekt som ett möjligt användningsområde av databasen om någon exempelvis myndigheter skulle vilja genomföra ett projekt liknande PCF. Då har vi ju en snärtig databas som de kan utgå från. Vi kan ju inte själva genomföra ett sådant projekt då vi med säkerhet inte kan lägga upp modern konst som hänger inomhus på Commons men det är ju ett potentiellt värde av vårt databasprojekt som vi bör peka på (exempelvis när vi söker ytterligare pengar för projektet).
Till fotoprojekt som WLPA presenteras flera argument för varför det är viktigt att ta bilder (ex. då allmänheten ofta inte kommer åt att se verken, att många saknar medvetenhet om de verk som finns runtomkring dem, och att de blir sökbara och lättillgängliga hemifrån genom projektet). Dessa argument kan vi ju använda oavsett om vi i dagsläget kommer att behöva ha ett mer avgränsat fokus till äldre konst än vad de hade (PCF tog ju bilder även på modern konst inomhus). Även om de inte är nya argument så stärks de ju av andra personer utanför Wikimedia säger samma sak – och till dess vi har någon inspelning på någon svensk som talar sig varm om vårt projekt kan vi ju hänvisa till de här länkarna.
- Under funderingar och diskussioner kring detta projektet har en del oklarheter kommit fram. Genom att ta upp dem här är det min förhoppning att feedback och kloka tankar ska kunna klara ut några av dessa.
Den första frågan gäller användargenererat (UGC) material. I databasen kommer det att inledningsvis enbart att finnas "officiellt" material från diverse kommuner etc. En av projektets mål är ju självfallet att berika denna informationen ytterligare med UGC material exempelvis genom bildlänkar till Commons. Man kan dela upp dessa bidrag i två kategorier, kompletterande och korrigerande.
Kompletterande information är information för fält (se parametrarna) där ingen officiell information tidigare fanns som bildlänkar, koordinater genererade från adresser etc.
Korrigerande information ersätter existerande officiell information. Detta kan vara rättningar i stavning och koordinater men även sådant som byte av namn/artist.
Kompletterande information är relativt oproblematisk och jag antar att vi accepterar alla dessa ändringar. För korrigerande information är situationen mindre klar. Visst vi vill självfallet ha rättstavningar, men ska vi acceptera att någon ändrar namnet på konstverket, eller vilken kommun konstverket finns i?
Frågan är även vem som ska kunna redigera informationen i databasen (korrigera och/eller komplettera). Ska informationen enbart kunna ändras genom wikipedialistorna (där anti-vandal mekanismer redan finns)? Ska tillgång till api:et kräva en nyckel så att enbart godkända appar (t.ex. OSM) kan ändra i den? Ska vi lämna den helt öppen så att den kan ändras hur som helst?
Tankar, åsikter, erfarenheter är alla välkomna.
Ett kort tillägg. Oavsett vilket så kommer det att finnas en mekanism för att visa aktuell data, officiell data + kompletteringar, enbart officiell data.
Jag håller helt med dig om kompletterande information, och att det är relativt oproblematiskt.
Vad gäller korrigerande är det klurigare, men om det finns en mekanism att även bevara den officiella blir det enklare. Wikipedialistorna har ju som du tror en god chans att inte bli förstörda så det är en väg att gå. Visst kan man hävda att det är klurigt att redigera och uppdatera på Wikipedia, men jämfört med att gå in och göra updates i en databas är det enkelt. Låser vi oss för hårt om vi enbart ska gå via Wikipedailistor? Eller är det lika enkelt att först importera en ny datakälla dit för att sedan suga in den i databasen jämfört med att importera den i databasen och sedan pusha den till en wp-lista?
Vad gäller API-nyckel ska det definitivt krävas en nyckel för att få redigera, där är det ju så lätt att sälla till stora problem på kort tid. Läsa kanske kan vara fritt däremot.
För anonyma redigeringar tycker jag nog att vi kan begränsa oss till Wikipedialistor (under förbehållet att sv.wiki är intresserade av denna data i listform). Tanken är i dagsläget att importera nya datakällor till vår databas och sedan pusha dessa till wp-listor. Efter detta bör uppdateringar till listorna sugas in i databasen och uppdateringar till databasen pushas till wp-listorna, typ en gång per dag.
Detta kräver att någon form av konfliktlösning designas. Dvs. om både databasen och listan uppdaterats men till olika värden vilken behåller vi då? Eller om en officiell uppdatering kommer som inte stämmer med den senaste versionen accepterar vi den ändå?
Angående API-nycklar håller jag definitivt med om att redigering ska kräva nyckel. Kan tänka mig att även läsning bör kräva nyckel så länge det även finns en öppen (read-only) "test" nyckel. Detta gör det enklare att blockera om någon börjar hamra databasen samt borde göra att vi kan se vilka verktyg som används aktivt. Frågan är snarare om en användare via t.ex. en OSM-app ska kunna redigera byggnadsåret. Dvs. att anti-vandalism ansvaret läggs även på dem.
En annan naturlig användare som kanske skulle vilja bidra med redigeringar via API är ju en väldigt samarbetsvillig kommun som själv vill kunna lägga till nyinköp direkt i listan.
Har diskuterat detta en del med John idag på kontoret och vi kom fram till följande:
I dagsläget ligger informationen i två lager: Senaste värdet samt originalvärdet (dvs. nyaste informationen från kommunen om objektet). Det senaste värdet är det som syns i wikilistor etc. Användare av api:et kan välja vilket av dessa de vill se.
Om kommunen skickar in en uppdatering så uppdateras båda värdena och därmed också wikilistan (med en relevant redigeringskommentar). Enbart fält där kommunen angivit ett värde skrivs över (i både databasen och wikilistan). Eventuella fält i wikilistan som inte finns i databasen (t.ex. fotnoter) påverkas inte. Om det visar sig att kommunens uppdatering är felaktig kan informationen lätt återställas genom den vanliga mekanismen på Wikipedia.
Behovet av redigering via api kan tittas på igen senare men i dagsläget tror jag inte att detta är något som behövs. Genom att redigera wikilistorna (via exempelvis Wikipedias api) blir vår databas indirekt uppdaterad samtidigt som transparensen och vandalskyddet i Wikipedia kan användas. Därmed skulle behovet av direkta api-redigeringar vara begränsade till uppdateringen av "officiell" information (av kommunerna snarare än oss) eller eventuella fält som finn i databasen men ej i wikilistorna. Om någon kommun skulle visa sig intresserad av detta (inte jättetroligt) kan mekanismen byggas till.
Jag tänkte att vi i den här tråden kan ge tips om olika kommuner som skulle kunna vara troliga deltagare i projektet. Jag startar med Umeå, baserat på deras OpenSource-attityd som bland annat presenteras i denna video: http://www.youtube.com/watch?v=yxULLasopDk (Tack Jakob för tipset!)
Örebro kommun är väldigt aktiva och har fått projektpengar från Vinnova.
SKL nämnde även, vilka är rätt självklara, Stockholms och Göteborgs kommun som lämpliga kommuner att kontakta inledningsvis.
Om jag inte missminner mig så arbetar/arbetade Grillo för Lunds kommun. Om inget bättre alternativ finns för kommun nr. 5 så skulle vi kunna kolla med honom hur deras attityd är till öppen data etc.
Vill minnas mig att även Helsingborgs kommun fick Vinnovapengar.
I boken Öppen källkod i Sverige (finns på kontoret) nämns Motala och Eksjö kommun som att vara tidigt ute. Där finns kanske en mognad för detta.
Hittade dessa av en slump, Hällefors kommun, Degerfors kommun och Karlskoga kommun har sidor om öppna data på sin webbplats och är antagligen i alla fall medvetna om frågan.
Jättebra! Då har vi många lämpliga kandidater att kontakta! P.g.a. de nödvändiga begränsningarna av WLPA bör vi dock inledningsvis fokusera på länsstyrelserna (som Konstrådet trodde hade listor med äldre konst) samt museerna - om inte Vinnova har något emot det. Jag ska skicka ett email och höra med dem om det under veckan.
Jan emailade mig även om Växsjö (http://gis.vaxjo.se/konst/) och Magnus Petzäll från SKL föreslog Borås kommun som tydligen ska ha satsat en hel del på konst.
Medan jag letade runt efter "skyddsvärd konst" begreppet stötte jag på Uppsala län och Halmstad kommun som båda ska ha databaser över sin konst, samt Hallands län som i den (då) skulle bygga upp sin databas.
OK. Då blir de första 5: Umeå, Örebro, Stockholm, Göteborg och Växjö. Omgång två blir bl.a. : Helsingborg, Motala, Eksjö, Hällefors, Degerfors, Karlskoga, Borås, Halmstad
Första omgången skickas imorgon bitti
Det låter som vettiga val!
Eva Fransson tipsade mig om att Kungsbacka kommun har haft ett projekt med att samla in information om alla konstverk i kommunen och ta bilder av dem. Kanske vore det värt att kontakta dem också.
OK. Då blir omgång två de ovanstående åtta plus Kungsbacka och Linköping.
Råkade hamna på Landstinget i Uppsala Läns hemsida och där står det att de har drygt 19 000 verk finns i samlingarna och om man vill veta var ska man ta kontakt med någon av de tre namnen på denna sida (nere till höger).
Axel berättade just att Staffanstorps kommun använder sig av CC-BY-NC-SA på sin webbplats, http://staffanstorp.se/, så de har uppenbarligen tänkt en del på saken och vore kanske lämpliga att kontakta gällande Vinnova-databasen.
@John: Jag lägger Staffanstorp till listan för nästa utskick. Fler tips är alltid välkomna.
@Jan: Både Uppsala och Hallands län verkar ha databaser. Dock trodde jag att originalplanen var att först och främst kontakta kommunerna. Om Vinnova är ok med att vi ändrar "kommuner" till "entiteter" (@John hade vi inte ett bättre ord?) så finns det praktiken inget som hindrar oss från att flytta upp landsting och Statens konstråd högre upp i listan. Det skulle förhoppningsvis även ge oss en större geografisk spridning.
Ja, originalplanen var att först kontakta kommunerna, eftersom att det var där vi trodde att datat fanns. Kolla gärna med Vinnova om det tycker att det är okej med våra mätbara mål, annars får vi ta dem i mån av tid.
@John. Skulle du kunna kolla av detta med dem eftersom ni tidigare varit i kontakt?
Självklart! Jag har skickat dem ett email som både handlar om vilka andra typer av dataset vi vill inkludera (utöver kommundataseten) och att du jobbar heltid med det här. Ber om ursäkt för att det tog mig lite tid att få iväg emailet. Det har varit hektiska dagar den sista tiden.
Inga problem. Eftersom jag hunnit läsa svaret kan jag passa på att upplysa här om att det inte var något problem med att inkludera de andra entiteterna (organisationerna?).
För att fortsätta från wikifikat igår: det vore ju riktigt coolt om Google kunde släppa alla kooordinater för statyer, då har vi ju data för verk i jättemånga länder. Detta leder till en annan fråga, hur gör vi om vi får data för statyer från olika leverantörer? Behöver vi kanske ha något matchningsverktyg? Detta kan ju också uppstå om vi får överlappande data från till exempel ett landsting och en kommun.
Lite information om spelet finns på http://www.ingress.com/
Tanken är att same_as fältet ska kunna användas för att indikera att två poster från olika källor pekar på samma objekt. Detta kommer t.ex. redan i dagsläget att ske i och med att kommunerna ibland inkluderar statens konstråds konst i sina listor. I dagsläget gör funktionen inget mer avancerat än att säga att de båda posterna är samma. I framtiden skulle man kunna se detta utvecklas till ett system där dessa poster slås samman under ett av id-numren och det andra fungerar som en omdirigering.
Ett problem som jag precis stötte på men inte tänkt på tidigare är hur man ska hantera verk med mer än en konstnär. Dels innebär det ett tekniskt problem i det att databasen inte var byggd med det i åtanke. Dels ser jag att det kan vara problematiskt med Wikipedialistorna som riskerar att bli krångliga att läsa av (maskinellt) om alla artister ligger i ett fält och väldigt klumpiga ifall vi ska kräva att var artist har ett eget fält (i tabellen kan de dock visas i samma fält).
I dagsläget funderar jag på flera parametrar i wikimallen (konstnär=, konstnär2= etc.) men har inte klurat ut en bra lösning för databasen.
Tips/förslag/tankar på hur detta bästa kan lösas (mallen och/eller databasen) är välkomna.
Ja det är ett mycket klurigt problem. Tekniskt sett skulle man kunna tänka sig att det finns flera rader för objekt med flera konstnärer. Men det kan göra det väldigt klurigt i andra sammanhang. Det man skulle kunna tänka sig annars är en annan teknisk kopplingstabell som i sig kan ha flera rader genom att den pekar på huvudtabellens nyckel. Det gör det lättare att hantera den första, men krånglar ju till det med att det måste joinas ihop för att få ut konstnärerna, vilket dock kan vara en "kostnad" som är värd att ta.
För databasen löste jag det med en kopplingstabell med dubbla unika index. Det gör dessutom att det, som en extra bonus, är lätt att få fram alla konstverk av en viss artist.
Det är en snygg lösning som medger flexibilitet för wikilistorna, oavsett vad vi väljer att göra där. Just nu lutar jag mot att vi kanske har en "huvudkonstnär" och en markering om det finns flera som har bidragit, med länk till en fråga ur databasen på det konstverket.