maandag 23 februari 2009

'De digitale feiten' en opslag



Afgelopen donderdag presenteerde Digitaal Erfgoed Nederland (DEN) de resultaten van het onderzoek De Digitale Feiten. Dit maakt deel uit van een Europees onderzoek (Numeric) naar de stand van zaken van digitalisering in het Europese erfgoed.

Er stroomden heel veel cijfers uit de beamer van de KB-aula donderdagmiddag, maar er bleek ook veel nog niet bekend. DEN directeur Marco de Niet concludeerde in zijn voorwoord bij het rapport: 'Als het project één ding heeft duidelijk gemaakt, dan is het wel hoe zeer de professionalisering van digitalisering nog op gang moet komen. Zelfs het maken van schattingen over omvang en kosten van digitalisering bleek een brug te ver voor veel instellingen.'


Rekenmodel van het Gelders Archief

Eén van de interessantste bijdragen aan de middag (als het om digitale duurzaamheid gaat) was de presentatie van Peter Wouters, hoofd Publieksbereik van het Gelders Archief. Hij vertelde over het rekenmodel dat zijn organisatie heeft ontwikkeld voor het begroten van digitaliseringsactiviteiten - een rekenmodel waarvoor in de zaal veel belangstelling was en dat door DEN verder uitgebouwd zal gaan worden.

'Waar we wel van schrokken', zo meldde Wouters, 'is dat we erachter kwamen dat vijf jaar opslag van gedigitaliseerd materiaal evenveel kost als de initiële investering.' En daarbij was nog niet eens sprake van een echt 'trustworthy' digitaal depot, maar van een gemengd pakket waarbij alleen waardevolle bronnen echt duurzaam werden opgeslagen.

(foto: Numeric website, http://www.numeric.ws)

woensdag 11 februari 2009

De Nationale Verkenning - een tussenbericht (1)


Hier rechts staat nog net geen eigen foto van een teamlid Nationale Verkenning Digitale Duurzaamheid, maar er komt wel heel wat papier aan te pas om de digitale wereld te onderzoeken, niet alleen omdat er veel rapporten verschenen zijn de laatste jaren, maar ook omdat je er zo lekker op kunt kliederen in de trein: uitroeptekens waar de auteur het bij het rechte eind lijkt te hebben, maar ook grote vraagtekens waar dat niet het geval lijkt. En grote gele markervlekken rond stukken input die we goed kunnen gebruiken voor ons onderzoek zijn handig bij het terugbladeren een paar weken later; ik heb nog geen digitale manier ontwikkeld om dat net zo overzichtelijk te doen.

Die stapels onderzoeken zorgen trouwens wel voor de nodige verzuchtingen in het onderzoeksteam. We hebben nu het stadium bereikt dat de hoeveelheid gevonden informatie het bijna belet om de grote lijnen te zien. Maar dat hoort bij het proces van zo'n verkennend onderzoek, daar krabbel je ook weer uit.

De interviews die we houden, momenteel vooral met mensen van wie we weten dat ze een goed algemeen overzicht hebben, zijn al wat concreter, maar ook daar is sprake van een veelheid aan problemen, belangen, en visies. Geheel volgens de Nederlandse poldertraditie.

Wij gaan daaruit zeker geen rechtlijnig geheel bouwen. Een 'orderly chaos' (titel van deze Amerikaanse lappendeken van Marilyn Wall) lijkt me een mooi alternatief - als we tenminste garen kunnen spinnen dat sterk genoeg is om de lappen stevig én flexibel aan elkaar vast te maken.

zondag 1 februari 2009

Lichtgewicht toetsing voor digitale data en archieven


De vraag is zo oud (nouja, bij wijze van spreken dan) als digitale archieven zelf: wanneer is de opslag veilig genoeg, wanneer kunnen aanbieders, archieven zelf en gebruikers de garantie krijgen dat de data over vijftig jaar nog helemaal intact en authentiek hergebruikt kan worden?

De afgelopen jaren zijn de nodige pogingen ondernomen om toetsingscriteria op te stellen voor digitale archieven (oftewel 'trustworthy digital repositories', TDR) en data, onder meer TRAC, oftewel Trustworthy Repositories Audit and Certification, DRAMBORA, en de Duitse
Kriterienkatalog van nestor. Dit zijn stuk voor stuk indrukwekkende instrumenten, maar wel met een flinke gebruiksdrempel, want er moet heel veel informatie boven tafel komen, en daar zijn nog lang niet alle organisaties aan toe.
Bovendien geldt dat de gevraagde garantie eigenlijk nog helemaal niet gegeven kán worden, want de techniek staat nog in de kinderschoenen.

Reden voor DANS, het data-archief voor de alfa- en gammawetenschappen, om een 'lichtgewicht' alternatief te ontwikkelen: het Datakeurmerk oftewel Data Seal of Approval (DSA). Het idee is om in zo weinig mogelijk woorden en richtlijnen vast te leggen wat de essentiële eigenschappen zijn die data en faciliteiten voor langetermijnbewaring moet bezitten. Een organisatie die daaraan voldoet, publiceert zijn onderbouwing op de website, en laat die door enkele collega-instellingen doorlichten. Als deze 'peer review' goed afloopt, krijgt de organisatie het zegel om op zijn website te publiceren, voor een jaar of misschien twee jaar.
Het idee voor een lichtgewicht toetsing van digitale data en archieven heeft inmiddels zo veel steun gekregen, dat DANS heeft besloten het keurmerk internationaal te verspreiden en om de regie over het keurmerk over te dragen aan een internationale Board, een soort redactieraad. Deze overdracht gaat in mei plaatsvinden. In dat kader organiseerde DANS afgelopen vrijdag 30 januari een workshop - om het concept te testen op een internationale doelgroep en diezelfde doelgroep om suggesties te vragen voor de verdere uitbouw van het keurmerk.


DSA met name goed voor 'awareness raising'
De deelnemers aan de workshop concludeerden unaniem dat het DSA een goede bijdrage kan leveren aan het verhogen van het bewustzijn van de problematiek van langetermijnbewaring. Mary Vardigan van ICPSR, het grootste digitale archief ter wereld op het gebied van sociale wetenschappen, sprak van een 'wonderful innovation'. Niet als concurrent van TRAC of DRAMBORA, maar als een toegankelijke opstap.


Uiteraard waren er ook kritische noten, in de vorm van aanbevelingen voor verdere ontwikkeling: Vardigan miste in de nu geformuleerde richtlijnen informatie over de organisatorische en financiële stabiliteit van de organisatie - een suggestie waar ik het roerend mee eens was. Ingmar Koch van LOPAI (zelf met versie 1 van ED3 zoekende naar criteria voor archieven), suggereerde dat de Board nog wat meer werk zou moeten verrichten om helder te kunnen krijgen wie waarom vier sterren verdient en wie één of twee. Men vroeg ook om meer implementatie-richtlijnen (die eind april gepubliceerd zullen worden, zo meldde Henk Harmsen). Niettemin moet het geheel wel lichtgewicht blijven, zo was de consensus, anders schiet het zijn doel voorbij.

De powerpointpresentaties zullen binnenkort worden gepubliceerd op de website van het DSA - hier alvast de presentatie van Henk Harmsen met de meest up-to-date redactie van de richtlijnen, waarvan er na de bijeenkomst geen 17 maar nog slechts 16 over zijn. Zie ook het commentaar van Ingmar Koch op de weblog van ED3.

Foto's: rechtsboven Henk Harmsen (l) en Peter Doorn (r) van DANS; midden: Natascha Schumann van nestor (l) en Annelies van Nispen (DEN); rechtsonder: Ingmar Koch van LOPAI, het Landelijk Overleg Provinciale Archief Inspecteurs. Foto's IA.