woensdag 16 december 2009

Het Planets-project: wat heb je eraan?

abadgesIedereen in het (DD-)wereldje heeft weleens gehoord van het vierjarige Europese Planetsproject voor duurzame toegankelijkheid, maar wie weet er nu echt het fijne van? Wie weet precies wat je eraan kunt hebben? Ook ik wist het niet. Nu het project (in mei 2010) ten einde loopt organiseert Planets op diverse plekken in Europa driedaagse ‘outreach’-evenementen, maar daarvoor moet je naar Londen (februari) of Rome (juni?). Frank Houtman van de KB (foto rechtsonder) bedacht vlak voordat hij vertrok naar de Gemeente Nieuwegein dat we ook iets moesten bieden voor de Nederlandse collega’s, en zo ontstond in Zo'n 85 deelnemers kwamen voor Planets naar Den Haagsamenwerking met het Nationaal Archief en de NCDD op 14 december het evenement ‘Planets: toolkit voor ons digitaal geheugen’ (alle presentaties). Het werd geen letterlijke vertaling van het driedaagse Planetsevenement, maar wel een ‘bloemlezing’, die blijkens de commentaren bij de borrel zeer op prijs werd gesteld. Een deelnemer die op het laatste moment moest afhaken vroeg om een zo volledig mogelijk rapport. Welnu, ik doe mijn best hieronder met links naar de presentaties en meer informatie elders.

Basisles duurzame toegankelijkheid

Op basis van de dia’s van Ross King van Planets verzorgde ondergetekende de basisles digitale duurzaamheid (wat ik tegenwoordig liever duurzame toegankelijkheid noem, maar dat terzijde): wat is het probleem met digitale objecten? En hoe moet je dat technisch oplossen?

Hoe verantwoord je de kosten? Op basis van risicomanagement

Vlnr Clive Billenness (Planets), Petra Helwig (NA), Frank Houtman (KB en bedenker van deze dag), Sara van Bussel (KB)

Ook in het NCDD-onderzoek bleek het een probleem: hoe krijg je geld voor duurzame toegankelijkheid? Hoe verantwoord je de tijd die je erin stopt aan je manager? Clive Billenness, de programmamanager van Planets, is tot een conclusie gekomen die ik dit jaar heel erg ben gaan delen: je kunt de kosten voor DT niet verantwoorden met winstprognoses later. Want de winst is niet te kwantificeren en de toekomst is een te vage klant De cirkel van het risicomanagementom je businessmodel op te baseren. Wat je wel kunt doen is in kaart brengen wat je digitale collecties je waard zijn, welke risico’s ze lopen, en hoe je die risico’s kunt beheersen. Zo’n handvat geeft je ook de mogelijkheid om prioriteiten te stellen: welke collecties zijn het belangrijkst voor je? Welke risico’s zijn het urgentst? Clive zette de producten van Planets in het kader van de bekende cirkel uit het risicomanagement (zie links) en maakte daarmee duidelijk dat er over Planets is nagedacht. Het is niet zomaar een losse verzameling gereedschappen, maar alles hangt aan elkaar, en bij iedere stap in het proces kun je gebruik maken van weer andere Planetsonderdelen. De stappen uit de cirkel en de Planetsdiensten die erbij horenVoor een overzicht verwijs ik graag naar de Nederlandstalige Planetsfolder die we voor de bijeenkomst hebben gemaakt.

Intermezzo: over de terminologie

Voordat Hans Hofman aan het woord kwam moest even een terminologische horde worden genomen: wat ik preserveren noem heet bij Hans conserveren. Maar we bedoelen er hetzelfde mee en ik beloof dat ik volgend jaar mijn best zal doen om vanuit de NCDD tot eenduidige benamingen te komen.

Of je het nu preserveren noemt of conserveren: je moet het plannen

Hans Hofman (NA) Hans Hofman van het Nationaal Archief ging dieper in op de zo belangrijke planningsfase: hoe neem je beslissingen ten aanzien van je collecties? Het was een kleine schok voor sommige deelnemers dat de sprekers er allemaal van uitgaan dat je bij bewaaracties (emulatie of migratie) altijd informatie zult verliezen [Toevoeging: maar zie ook de commentaren onder deze blog met iets andere meningen]. Het is dus zaak om van te voren te bedenken welke informatie verloren mag gaan en welke niet. Welke keuzes een organisatie daarin maakt zal afhangen van de missie en doelstellingen Hans Hofman: alle keuzes zijn afhankelijk van het beleid van je organisatievan een organisatie: voor een archiefstuk zal de kleur van een lijntje nauwelijks belangrijk zijn, maar voor een kunstwerk kan het essentieel zijn. Die keuzes kan  Planets niet van je overnemen, betoogde Hans Hofman, maar als je ze eenmaal gemaakt hebt kunnen de Planetsgereedschappen, met name de Planets Preservation Planning Tool (PLATO) je helpen om die keuzes ook goed te implementeren. De tools kunnen de collecties analyseren op bestandsformaten, ze kunnen de risico’s in kaart brengen en ze kunnen de beste bewaaracties adviseren – maar allemaal op basis van een eisenpakket dat je zelf moet opstellen. Uit de zaal klonk gemompel – diverse deelnemers gaven aan dat hun organisatie helemaal geen beleid had en dat het jaren zou duren voordat er enig beleid op papier zou kunnen worden gezet. En toch ben je nergens zonder zo’n plan …

Diverse mogelijkheden uitproberen op het Testbed

Slechts een bitje verschil .... Petra Helwig van het Nationaal Archief liet heel beeldend zien wat de consequenties kunnen zijn als je op een kritiek punt één enkel bitje verliest bij een migratie. Het is dus vooral zaak om Planets en andere diensten uit te proberen voordat je ze loslaat op je collecties. Daarvoor is het Testbed ontwikkeld, waar je met je eigen gegevens of met corpora (gegevensbestanden) die door Planetspartners zijn ingebracht naar hartenlust kunt experimenteren – niet alleen met de software van Planets zelf maar ook met allerhande andere programma’s die door Planets zijn ‘ingepakt’ (wrapped) tot diensten. De live demonstratie lukte maar kan hier niet herhaald worden – wie wil zien wat er allemaal kan met het testbed kan zelf inloggen bij Planets en zich bij de helpdesk aanmelden als tester.

Rechts Sara van Bussel; links de onmisbare schakel achter de schermen: KB-collega Frederique Vijftigschild. Bedankt, Fre! Hoe selecteer je preserveringsdiensten?

Sara van Bussel van de KB vertelde over de ‘gap analysis’ van Planets. In een brede enquête vroeg het team de 16 Planetspartners welke bestandsformaten men in huis heeft. Daarna onderzocht Sara voor welke bestandsformaten er migratie- en emulatietools zijn. Die werden vervolgens opgespoord en ‘ingepakt’ tot diensten om in de Planetsomgeving te kunnen worden gebruikt. Ook zitten ze allemaal in de Core Registry die Planets heeft ontwikkeld: een database met alle bekende bestandsformaten en de bekende tools. Die Registry wordt o.a. gevoed door experimenten op het Testbed en levert weer input voor Plato. Ook in Planets hangt alles met alles samen.

Clive Billenness: 'Experimenteer wat je wilt, maar we zitten nog in de beta-versie; het is allemaal nog niet af.'Maar wat héb je er nu aan?

Het was indrukwekkend wat we allemaal te zien kregen, in praktische en technische zin – maar natuurlijk waren er ook een aantal kanttekeningen. De eerste gaf Clive Billenness zelf in zijn bonuspresentatie 'Putting it all together': alle Planetsdiensten zijn momenteel nog in de betaversies. Via de website kun je ermee experimenteren, maar je kunt er nog niet echt op bouwen. Dat kan pas met de definitieve versies die eind mei gepubliceerd worden als het project ten einde loopt. Natuurlijk roept dat projecteinde ook weer vragen op: wie gaat de Planetsdiensten onderhouden als het project is afgerond? Clive vertelde dat er plannen zijn voor een structurele Planets-community. Ook gaf hij aan dat enkele grote organisaties de Planetsdiensten gaan gebruiken, wat weer voor continuïteit zal zorgen. Ik hoop dat dat goed van de grond komt.

Defensie en Buitenlandse Zaken (Niels van Heezik) bespreken het nut van Planets In de discussie had Mirjam Eikelboom van Rijkswaterstaat de nodige vragen bij het nut van Planets voor de archiefvormers binnen de overheid. Hoe is het gesteld met de taakafbakening tussen de archiefvormer en het Nationaal Archief? Gedeeltelijk ligt die wettelijk vast, zo vertelde Hans Hofman, maar voor eigen rekening voeg ik daaraan toe dat het NCDD-rapport wel duidelijk heeft gemaakt dat het digitale tijdperk om nieuwe afspraken vraagt. Het NA experimenteert ook al met nieuwe vormen van overdracht, onder andere met Binnenlandse Zaken.

Marjet Douze van Aletta stelde hardop een vraag die een aantal andere vertegenwoordigers van kleine organisaties in gedachten moeten hebben gehad: ‘Krijg je er een consultant bij?’ En toen waren we terug bij het thema dat bijv. ook vorige week ter sprake kwam: kennis en informatie zijn cruciale factoren – en we hebben er nog veel te weinig van. Toen Marjet aan het panel van sprekers vroeg waar ze die als (piep-)kleine organisatie kon vinden, was het antwoord van Hans Hofman: door te gaan samenwerken met anderen.

Aan het eind van een jaar vol NCDD-activiteiten, waarin we ons rapport opleverden, een conferentie organiseerden, ik op vele plekken mocht komen praten over duurzame toegankelijkheid en de bezoekersstatistieken van deze blog er niet om logen, is wat mij betreft daarmee de agenda gezet voor 2010: kennis en samenwerken, zo praktisch en bruikbaar mogelijk: er is nog veel werk te doen!


(Voor wie nu echt alles in detail wil weten van Planets en er zelf mee wil experimenteren is er op 9-10-11 februari in London een driedaagse training. Ingmar Koch blogde in juni over een dergelijk evenement in Kopenhagen en ging veel dieper in op de technische aspecten.)

zaterdag 12 december 2009

Kan iederéén digitaal archiveren ?

De zaal zat met 134 inschrijvingen bomvol Maar liefst 134 DIV- en archiefmedewerkers van overheidsinstellingen hadden zich ingeschreven voor het seminar ‘Digitaal archiveren’ van Dominique Hermans (DO Consultancy) (de presentaties worden z.s.m. gepubliceerd op de DO website). De in kerstsfeer gestoken Concordiazaal in Woerden zat dan ook bomvol – met mensen die zelf bijna allemaal werken in een papieren werkelijkheid, zo bleek. Het archiefstuk is inderdaad nog meestal een printje met een natte handtekening. Niettemin wilden deze mensen zich voorbereiden op een digitale wereld, anders waren ze niet naar Woerden gekomen. Hebben de sprekers ze op weg geholpen?

De wereld van de NCDD: sectoren met voortrekkers voor de infrastructuur 'Tegenstrijdige' adviezen

Ogenschijnlijk kregen ze tenminste twee nogal verschillende adviezen voorgeschoteld. Ikzelf opende het seminar vanuit de filosofie van de NCDD: duurzame toegankelijkheid is een dermate grote uitdaging dat organisaties het niet alleen af kunnen en vooral de samenwerking moeten zoeken, schaalgrootte moeten realiseren, om het allemaal betaalbaar te houden (volledige tekst van de presentatie). Filip Boudrez van eDAVID, het expertisecentrum dat nauw is verbonden met het Antwerpse Felixarchief, ging daar een beetje tegenin (dia’s komen hier). Zijn filosofie: iederéén kan digitaal archiveren, ook op kleine schaal, als je maar genoeg kennis hebt van de risico’s en wat je moet doen om die te beheersen. (Zie ook eerdere blog over Felixarchief).

Het officieel uitziende mailtje dat nep bleek te zijn Opslaan + context = archiveren

Een belangrijk risico voor archiefbescheiden is het verlies van de context. Iedereen kan informatie opslaan, maar alleen de context, de neerslag van het proces maakt van een brok informatie ook een archiefstuk. Filip illustreerde dit aan de hand van een – op het oog zeer officieel aandoend – mailtje van de Antwerpse burgemeester aan een van zijn schepenen (foto). Alleen: het bleek een losse flodder, door Filip zelf gemaakt. Digitaal archiveren is namelijk vooral een opgave van documentatie – alleen door in het digitaal object alle informatie op te slaan over hoe het document tot stand is gekomen (technisch Filip Boudrez: 'Zo moeilijk is het toch allemaal niet.'en organisatorisch) kun je de authenticiteit van het document bewijzen. Al die informatie sla je op in XML-doosjes, het Archival Information Package uit het OAIS-model (zie mijn tekst, pp. 8-9). Meer is het niet, leek Filip te zeggen, je kunt zo aan de slag. Het Antwerpse eDepot begon ooit met 20 cd’s, €675 aan software en 0,3 fte. Het is gewoon een kwestie van heel consequent en precies in het AIP opslaan hoe het brok informatie door het proces is gegaan. Welke software, welke versie, welke hardware, welke stappen, en ga zo maar door. En dat hoef je niet eens met de hand te doen, nee, dat kun je – en moet je zelfs - in hoge mate automatiseren om zoveel mogelijk menselijke fouten uit te sluiten.

Dominique Hermans was zelf verrast door het hoge aantal inschrijvingen Kon ik wel naar huis met mijn NCDD-verhaal? Je zou het bijna denken. Maar zo zwart-wit is het natuurlijk ook allemaal weer niet. Ook in mijn eigen verhaal had ik benadrukt dat de plannen van de grote voortrekkerorganisaties om een infrastructuur in hun sector te bouwen tijd kosten – en geld, wat momenteel ook veel tijd kost. Bovendien is het nooit de bedoeling geweest dat organisaties als het Nationaal Archief de verantwoordelijkheid van kleinere organisaties over gaan nemen. Iedere organisatie, ieder archief, blijft zelf verantwoordelijk als archivaris, en moet dus kennis hebben van het digitale proces om daar verantwoordelijkheid voor te kunnen nemen. Maar als de NCDD-plannen uitgevoerd worden zullen ze een deel van het werk kunnen uitbesteden, in de back office slimmer kunnen werken. Want het duurzaam beheren van een paar bestanden kun je misschien zelf ter hand nemen - zodra het om miljoenen objecten gaat wordt het toch een ander spelletje. Hoe meer leveranciers, hoe meer soorten digitale informatie, hoe lastiger het wordt.

powerpoint in kerstsfeer

Filip en ik waren het wel roerend eens over één ding: voor geen enkele organisatie mag het een optie zijn om niets te doen, om af te wachten tot bijvoorbeeld het Nationaal Archief alle problemen gaat oplossen. Wat dat gaat niet gebeuren, zeker niet op de korte termijn. Voor iedere organisatie, groot of klein, is het mogelijk om met weinig middelen al heel wat 'We do not need best practices, we need survival practices' (Clifford Lynch)maatregelen te nemen die de risico’s op verlies van digitale gegevens te verkleinen. Ik noemde dat in mijn presentatie survivallen, Filip ziet het meer als een structurele aanpak (misschien omdat België geen NCDD heeft ;-)?), maar het gaat om  hetzelfde principe. Duurzaamheid is een kwestie van risicomanagement en heel eenvoudige, praktische maatregelen kunnen de risico’s al drastisch beperken. Zoals Filip het zei: ‘Bezie de techniek als een variabele; het belangrijkst is het om je eigen workflow goed te regelen, vooral ten aanzien van de documentatie. Door alles goed te documenteren maak je de digitale gegevens zo autonoom mogelijk, zo min mogelijk afhankelijk van heel specifieke software en hardware.’ In zijn presentatie gaf Filip een 10-stappenplan voor een digitaal archief. Wat mij betreft lezenswaardige kost voor iedere DIV’er en archivaris (presentatie volgt op seminarpagina).

Geert-Jan van Bussel (li) in gesprek met Arjan de Vries (Archiefinspectie Groningen) Stápels regelingen - maar wat is de praktijk?

Geen sector heeft zoveel regels en afspraken en protocollen als de overheid, dat bleek ook uit het NCDD-onderzoek. Maar die leiden niet tot duurzaam gedrag. Geert-Jan van Bussel hield een presentatie over het ODF-formaat – het platformonafhankelijke bestandsformaat dat gebruikers autonomer maakt van de grote softwarefabrikanten. Hij vroeg zijn publiek wie dit formaat al gebruikte. Bijna niemand stak zijn hand op. En dat terwijl het formaat al een tijdje geleden verplicht is gesteld voor de gehele overheid. ODF is volgens Geert-Jan vooral een interoperabiliteitsstandaard. Bij de duurzaamheid heeft hij nog wat twijfel, maar dat zal de toekomst leren. Filip Boudrez gebruikt ODF in elk geval wel.

Netwerken Sympathiek maar wat te lang was de presentatie van AutiTalent, een bedrijfje dat autistische mensen inzet voor digitaliseringswerkzaamheden, en de software die zij gebruiken om het proces in te richten (ezModeler van 14Change). AutiTalent is een uitzendbureau voor autistische mensen; met hun gevoel voor en behoefte aan strakke structuur zijn zij uitermate geschikt om werkzaamheden te doen op het gebied van archiveren en digitaliseren. Een win-win situatie, die aan iemand de opmerking ontlokte dat het misschien een stuk beter gesteld zou zijn met de informatiehuishouding van de overheid als we allemaal autisten waren. Ik moest er ook aan denken toen ik in de theepauze werd aangesproken op mijn pleidooi voor eigen verantwoordelijkheid van archivarissen en DIV’ers om de brug te slaan naar de producenten van digitale informatie - die het langetermijnperspectief meestal niet op hun netvlies hebben staan. De DIV’er zit meestal niet in een positie in een organisatie waar hij of zij invloed kan uitoefenen op het beleid, zei mijn gesprekspartner, dus zou ik mijn pleidooi niet in deze zaal moeten houden maar bij bestuurders. Natuurlijk, daar moet ook het nodige gebeuren, en daar zal de NCDD zich ook voor inzetten, maar een man als Filip Boudrez laat zien dat een paar individuen met lef en enthousiasme en kennis van zaken grote invloed kunnen hebben ten goede. Kijk maar wat ze in Antwerpen bereikt hebben: een volledige aansluiting van het archief op de informatiehuishouding van de gemeente.(Hoewel, de grote rol van Filip is natuurlijk ook weer een risico voor duurzaamheid, want afhankelijkheid van één of enkele personen moet je eigenlijk niet willen, maar dat terzijde.) Laten we het erop houden dat ze alle twee in actie moeten komen: die managers en de DIV’ers.

Het Woerdense kerkplein na afloop

vrijdag 4 december 2009

‘Door data gedreven …

Cabaretier Joop Vos vermaakt het publiek in de Glazen Zaal in Den Haag. Op de voorste rij de sprekers: vlnr Louis Pols (dagvoorzitter), Ewoud Sanders, Henk den Heijer (half achter), Peter Doorn, Willem Bouten, een vertegenwoordiger van NWO, Johan van Rooijen, Esther Jansma en Frank van Harmelen. . . of het verhaal van een ooievaar die de spoorwegen gebruikt om naar huis te komen; het verhaal van het parlementslid dat het vaakst het woord “ik” gebruikt; het verhaal van Mies Bouwman en “Open het dorp”; en de vele persoonlijke geheimen die liggen opgeslagen bij het CBS.’

Voor wie, zoals ik, werkt aan de voorwaardenscheppende kant van de digitale data (beleid, financiën, enzo) is het altijd stimulerend als je mag snuffelen aan wat er helemaal aan de andere kant van de pijplijn uit al die noeste arbeid komt – wat duurzaPeter Doorn, een trotse DANS-directeuram beheer van digitale gegevens uiteindelijk oplevert. Wat we eraan hebben. Afgelopen donderdag 2 december was daar ruim de gelegenheid voor tijdens het symposium dat Data Archiving and Networked Services (DANS), het digitale archief voor de alfa- en gammawetenschappen, in De Glazen Zaal in Den Haag organiseerde – om te vieren dat het vijf jaar bestond, maar ook omdat de eerste dataverzamelingen die DANS beheert vijfenveertig jaar geleden werden aangelegd. Met trots meldde DANS-directeur Peter Doorn (foto links) aan het begin van het symposium dat de allereerste dataset in DANS EASY, P0001, een analyse van de TV/radio marathon van Mies Bouwman rond ‘Open het dorp’, nog steeds toegankelijk is en ook nog gebruikt wordt. Daarna liet Doorn vooral het woord aan de gebruikers van de data.

Ewoud Sanders: super user

Ewoud SandersJournalist en taalhistoricus Ewoud Sanders mag met recht een super user worden genoemd. Hij liet zien hoe je uit een veelheid aan bronnen op internet je eigen digitale bibliotheek kunt bouwen. De zijne bevat inmiddels 4,5 miljoen pagina’s. Zijn motivatie? ‘De psychologie van het zoeken’ – oftewel: als je alleen maar analoge bronnen gebruikt heb je de neiging om steeds weer naar dezelfde bronnen te grijpen. Sanders noemde het auteursrecht als zijn belangrijkste hinderpaal, maar veel leek hij zich er niet van aan te trekken. Ik vond het indrukwekkend, maar enkele onderzoekers onder het publiek vonden het allemaal toch niet systematisch genoeg om wetenschappelijk verantwoord te zijn. Ik moest denken aan afgelopen maandag bij de Museumvereniging: ook hier dus nog steeds spanning tussen de web 2.0-generatie en de traditie.

Over hoe de ooievaar energiezuinig naar huis vliegt

Willem Bouten van de onderzoeksgroep Computational Geo-Ecology aan het Instituut voor Biodiversiteit en Ecosysteem Dynamics van de UvA

Willem Bouten van de Universiteit van Amsterdam liet het publiek weten dat er vrijwel iedere dag op Schiphol wel een ongeluk plaatsvindt tussen vliegtuigen en vogels. Misschien hadden we dat liever niet geweten. Maar Bouten doet er ook wat aan. Door gegevens over vogelmigraties uit allerlei verschillende bronnen samen te voegen in virtuele laboratoria heeft zijn onderzoeksgroep bijgedragen aan een ‘Bird Avoidance Model’ dat de Luchtmacht in staat stelt om trainingsschema’s aan te passen aan de vogeltrek en daarmee ongelukken te voorkomen. Dat is mooi en zelfs praktisch nut. En ja, als zo’n ooievaar eenmaal een GPS-zendertje om heeft, dan kom je er ook achter dat hij bij voorkeur over de spoorrails terugvliegt naar zijn nest, omdat de zwarte stenen onder de spoorstaven voor een flinke portie thermiek zorgen. En dat scheelt weer vleugelbewegingen.

Van oude bomen en data die niet voorbij mogen gaan

Niet zonder humor, deze analoge ondersteuning voor de symposiumbezoekers ;-)Ik had er nog nooit van gehoord, van de ‘dendrochronologie’, de boomtijdkunde, maar sinds de toespraak van Esther Jansma van de Rijksdienst voor Cultureel Erfgoed (RCE) ben ik toch anders aan gaan kijken naar wat je allemaal aan informatie kunt halen uit oud hout: waar het vandaan kwam, hoe oud het is, waarvoor het gebruikt is, en ga zo maar door. Een probleem is wel dat er nauwelijks geld was voor het opslaan van de culturele data die je uit bomen kunt halen. Maar met de Digital Collaboratory for Cultural Dendrochronology in The Low Countries’ (DCCD) en het TRiDas dataformaat lijkt verbetering op dit front nog slechts een kwestie van tijd.

Privacyzorgen, ons slavernij-imago aan diggelen en een interpellatiegraaf

Cabaretier Joop Vos maakte zijn eigen 'interpellatiegraaf' van het symposium. Inclusief die GSM die drie keer afging en opgenomen werd ... Johan van Rooijen van het CBS moest heel erg zijn best doen om zijn publiek ervan te overtuigen dat die enorme hoeveelheden privacygevoelige gegevens die het CBS verzamelt ook veilig worden opgeborgen en alleen anoniem gebruikt mogen worden. Het leek er even op dat de bezoekers van het symposium zich meer zorgen maakten om hun privacy dan dat ze de onderzoeksmogelijkheden zagen van al die bewaarde data. Henk den Heijer maakte korte metten met ons imago als belangrijke slaventransporteur in de zeventiende eeuw door aan de hand van data te bewijzen dat wij ‘slechts’ 5% van de handel in handen hadden. Wetenschappelijk onderzoek kan dus ook weleens meevallen, hoewel …Maarten Marx

Maarten Marx van PoliticalMashup analyseert enorme hoeveelheden tekst, zoals de Handelingen der Staten Generaal die momenteel gedigitaliseerd worden. Door 'woordjes te tellen' kwam hij erachter dat het Rita Verdonk is die het woord ‘ik’ het meest in de mond neemt. Marx zet de interactie uit die handelingen bijvoorbeeld om in een interpellatiegraaf, een analyse van de interactie tussen parlementsleden. Cabaretier Joop Vos (foto links onder), die het symposium vanuit een hoek zorgvuldig volgde en tijdens zijn intermezzo’s op de korrel nam, liet zich hierdoor inspireren en maakte zijn eigen analyse van de interactie tijdens het symposium (foto linksboven).

Het hele symposium werd vanuit een hoekje nauwlettend gadegeslagen door cabaretier Joop Vos. Hij voorzag dit 'Libelle-uitje' van de duurzame databewaarders van het lijflied 'Het leven is zo mooi als je met de data bezigbent'.

‘Data wants to be free’

De slotakte werd verzorgd door Frank van Harmelen – een meer bevlogen ontnuchtering kan ik me nauwelijks voorstellen. Waar we tijdens de vorige lezingen nog het gevoel hadden gekregen dat iedereen die data zoekt die ook kan vinden (ook al kost het soms wat moeite), maakte Frank van Harmelen snel een einde aan die illusie: Er is van alles, maar het is niet geïntegreerd en dus kan de wetenschap er niet bij. Frank van Harmelen De oplossing? Web 3.0, het semantisch web. Waar web 1.0 een kwestie was van ‘plaatjes en praatjes’, web 2.0 dat van het niet alleen lezen maar ook schrijven, moet web 3.0 dat van de data worden, niet van links tussen webpagina’s, maar van links naar de originele data, leesbaar door computers, en daardoor nuttig voor mensen. De wonderolie is de standaardsyntax RDF die ‘dingen’ beschrijft en de ‘relaties tussen dingen’. Voorwaarde voor web 3.0 als ‘wetenschapsversneller’  is wel dat zoveel mogelijk data vrij op het web beschikbaar komt. Of, zoals van Harmelen het zei: ‘Data wants to be free!’.

De toekomst van DANS

Er is dus nog genoeg werk te verzetten. Peter Doorn wil dat werk graag oppakken. Hij verwees naar het NCDD-rapport Toekomst voor ons digitaal geheugen en gaf aan dat in de strategie waar het NCDD-bestuur momenteel aan werkt de rol voor DANS, dat momenteel alleen werkt voor de alfa- en gammawetenschappen, weleens disciplineonafhankelijk zou kunnen worden. Daarover wordt momenteel overlegd, onder andere met het Ministerie van OCW.

Dit symposium had zijn eigen glazen plafond.

dinsdag 1 december 2009

Born-digital: 'complex gedoe' voor de erfgoedsector?



Op 30 november organiseerde de sectie SIMIN van de Museumvereniging samen met het Overleg Kunsthistorische Bibliotheken Nederland een themadag over "Born-digital: (hoe) bewaar je dat?" Zo'n negentig deelnemers, voornamelijk vertegenwoordigers van musea, kwamen voor de themadag naar het prachtige nieuwe pand van de Rijksdienst voor Cultureel Erfgoed (RCE) in Amersfoort - en dat is een teken aan de wand dat het onderwerp 'digitaal' nu echt op de agenda staat bij de cultureel erfgoedsector. De powerpoints zijn gepubliceerd en de organisatoren zullen later een uitgebreider verslag publiceren (link volgt), maar hier alvast wat impressies.

Web 2.0 ontmoet traditie in de erfgoedsector
Wat me het meest opviel aan de bijeenkomst, was dat er sprake was van een spannende ontmoeting tussen tradities in de erfgoedsector enerzijds en alles wat ik voor het gemak maar even web 2.0 noem. Gevestigde instellingen versus spontane initiatieven op internet; door experts opgestelde lijsten van trefwoorden versus tags door jan-en-alleman; top-down versus bottom-up. Ik wil de tegenstellingen niet uitvergroten, maar dat er spanning is, een beetje zoals die ook zichtbaar is in het RCE-gebouw zelf (foto links), is duidelijk. Ook viel me op dat vertegenwoordigers van de grote koepelinstellingen in het cultureel erfgoed, RCE zelf, maar ook het Instituut Collectie Nederland (ICN), tussen neus en lippen aangaven nog weinig verstand te hebben van 'digitaal'.

Eisen voor duurzaam digitaal beheer
Aan ondergetekende de eer om in de keynote het algemene plaatje te tekenen: wat maakt digitaal anders dan analoog en wat heeft dat voor gevolgen?. De NCDD heeft uit die opsomming inmiddels een aantal conclusies getrokken: voor duurzame toegankelijkheid heb je schaalgrootte nodig en heel veel samenwerking tussen kleine organisaties die die schaalgrootte missen.
Dat heeft geleid tot een plan om per sector een voortrekkerorganisatie te benoemen die in samenspraak met organisaties uit de sector een infrastructuur voor duurzame toegankelijkheid gaat ontwikkelen. Over die plannen is de NCDD momenteel in gesprek met het Ministerie van OCW. Maar vooralsnog heeft de NCDD tenminste één flink probleem: er ontbreekt een vanzelfsprekende voortrekker in het domein van het cultureel erfgoed. Ook daarover wordt momenteel overlegd, onderling en met het Ministerie van OCW. Wordt dus vervolgd.





De praktijk van webarchivering
Het werd tijd om over de praktijk te gaan praten. De Koninklijke Bibliotheek is in 2006 gestart met het harvesten van 2.500 websites rond het thema 'Nederlandse taal, cultuur en samenleving'. René Voorburg van de KB gaf daarover een gedegen inleiding waarbij hij de hele workflow beschreef: selectie; het verkrijgen van toestemming; het harvesten m.b.v. een 'web curator tool' en Heritrix; de kwaliteitscontrole (erg lastig, vooral als het om interactieve sites gaat), de duurzame opslag in (W)ARC formaat; en dan - hopelijk begin 2010 - de online beschikbaarstelling (dia's op slideshare).

Na deze gedegen inleiding was het Peter van Wijngaarden van het Gemeentearchief Rotterdam die de lachers op zijn hand kreeg door zijn presentatie als volgt te beginnen: 'Ik ga u deelgenoot maken van de ellende waar je in terechtkomt als je websites wil gaan archiveren. Na afloop zal ik uw medeleven graag in ontvangst nemen.' Het verhaal dat volgde laat zich raden en de kwalificatie 'complex gedoe' uit de titel mag aan Peter worden toegeschreven. Daarmee was Peters conclusie al bijna gegeven: het Gemeentearchief Rotterdam is het nog net gelukt om jaarlijks 268 websites te harvesten, maar kleinere organisaties moeten er maar niet aan beginnen.
Maar wat betekent dat? Tijdens de discussie zei een deelnemer daarover: Betekent dit dat De Toekomst alleen De Rotterdammer zal leren kennen en daarop zijn beeld over de Nederlander anno 2009 zal moeten baseren? Deze vraag bevatte een serieuze ondertoon: juist op internet verdwijnt informatie waar je bij staat, en er wordt nog maar zo ontzettend weinig van gearchiveerd. Moeten we daar niet eens snel actie op ondernemen? Een mooie taak voor de NCDD, zei iemand. Vraag en aanbod koppelen, lijntjes leggen en collectieafspraken maken. Nu loop ik al langer met het plan rond om een NCDD-conferentie te organiseren rond webarchivering in Nederland, dus dat komt goed uit. Maar ook ik moet even afwachten wat alle discussies rond de landelijke infrastructuur en de NCDD de komende maanden gaan opleveren voordat ik daar plannen over kan gaan uitwerken.

Annet DekkerDigitale collecties
In het middagprogramma was er meer aandacht voor digitale collecties zelf. Annet Dekker van het Virtueel Platform e-Cultuur gaf een breed overzicht van de 'Conservering van Netkunst', met o.a. de conclusies van de Expert Meeting Archive 2020 die Virtueel Platform dit voorjaar organiseerde. Internetkunst en Netkunst zijn niet gemakkelijk duurzaam te bewaren, zo werd duidelijk, want vaak gaat het om performances, om installaties, om interactie. Juist dat proces maakt de kunstuiting interessant, en juist dat proces kun je maar lastig archiveren. Annet gaf aan dat het ondoenlijk is om alles te conserveren, maar suggereerde om inspiratie te putten uit de archeologie, waar men aan de hand van gevonden fragmenten een virtueel geheel bouwt.
Karen te Brake van ICN gaf aan dat duurzame toegankelijkheid van digitaal materiaal voor het kennisinstituut dat ICN is 'behoorlijk nieuw' is, maar, benadrukte ze, ICN wil er wel bij betrokken raken. Vervolgens introduceerde zij het INCCA netwerk van professionals voor het beheer en behoud van hedendaagse kunst. Fabienne van Beek presenteerde het Dutch Design Museum in Breda.

Digitale 'archeologie' bij het NAi
Het slotakkoord werd verzorgd door Henk Vanstappen van het Nederlands Architectuur Instituut in Rotterdam (NAi), die geflankeerd door een oerhollandse Kinderdijkmolen liet zien wat er allemaal bij komt kijken als je als erfgoedinstelling een doos floppies/dvd's bezorgd krijgt die het archief van een bekend architect bevatten. Zonder metadata, zonder toelichting, zonder hard- of software.
Hij liet e.e.a. zien aan de hand van een praktijkvoorbeeld: een 3D-model van een niet uitgevoerd ontwerp van Cahen voor het Van Abbemuseum. Ook bij de borrel liet Henk doorschemeren dat hij dit soort puzzels wel leuk vindt. Gewoon ergens beginnen en kijken waar je uitkomt. Maar voor het NAi is het een arbeidsintensief en dus kostbaar proces. Konden we die architecten en kunstenaars van te voren maar leren hoe ze met hun data om moeten gaan!




Medewerking van de kunstenaars?
De meningen verschilden over de mate waarin je kunstenaars kunt dwingen c.q. verleiden om hun digitale bestanden zo in te richten dat ze later gemakkelijk te archiveren zijn. Ikzelf ben daar nogal pessimistisch over, zeker wat betreft internetkunst. Dat is toch juist een kwestie van de grenzen opzoeken van wat mogelijk is, met lak aan alle standaarden? Maar ik had een leuke ontmoeting tijdens de bijeenkomst met Karin van der Heiden die zich onder de naam PARKC als zelfstandig adviseur heeft gevestigd op het gebied van datamanagement voor kunstenaars, architecten, etc. We waren het er snel over eens dat het weliswaar kan werken, maar dan moeten de producenten er een direct belang bij hebben dat hun data goed geordend wordt. In de wetenschap zie je dezelfde patronen: wetenschappers willen wel meewerken als ze er zelf ook iets aan hebben. Hier ligt een duidelijke opdracht voor de archiverende instellingen en het levert ook weer inspiratie voor een nieuw en nuttig zelfstandig beroep.

De handen uit de mouwen
Ik kan het niet laten om aan het eind van deze blog een stokpaardje te berijden dat ik ook in mijn keynote liet zien. Ja, het is allemaal ingewikkeld en ja, het is allemaal veel, maar laten we in hemelsnaam gewoon beginnen bij wat we nu al zelf kunnen doen en dus de handen uit de mouwen steken. Keuzes maken op basis van je missie en je eigen collectieprofiel, al die content van dvd's en floppies halen en op een stevige computer zetten. Daar een back-up van maken en die bij een collega onderbrengen. Karin van der Heiden had ook een mooie: gebruik geen punten of spaties in je bestandsnamen. Zo elementair, maar ook zo belangrijk als je de risico's wilt indammen. Het zijn allemaal geen maatregelen die onze collecties tot sintjuttemis toegankelijk zullen houden, maar hopelijk wel de komende vijf jaar. En die geven ons de tijd om met alle partijen om de tafel te gaan zitten en een slimme taakverdeling te maken. Of er gewoon voor te gaan, zoals Linda Tadic van het Audiovisual Archive Network (zie blog 27 november).