Inge Angevaare's blog over duurzame toegang tot digitale informatie in Nederland en daarbuiten
Blog of the coordinator of the Dutch Digital Preservation Coalition NCDD
vrijdag 17 september 2010
Kosten (2): koffiedikkijken of serieuze planning?
Soms schud ik na een bijeenkomst nog in de trein een blogpost uit mijn mouw. Dan sta ik bij wijze van spreken te trappelen om het verhaal te doen. Vandaag is een ander verhaal. Vandaag kost het me moeite om uit een berg aantekeningen en een vol hoofd de lijnen te halen waar ik jullie een plezier mee kan doen. Ik kies dus maar voor de zoetzure aanpak.
Het ideaalplaatje ziet er zo uit: een organisatie wil weten wat de kosten van duurzame opslag de komende jaren gaan worden. Ze halen een modelletje van internet, typen daar een aantal variabelen in, en voilà, daar ligt de begroting. Als de begroting niet bevalt (te duur) verander je een aantal variabelen in je beleid, net zo lang tot er een passend kostenplaatje ligt.
Zoet: na gisteren weten we wat er in de wereld te koop is aan modellen en benaderingen; zuur: geen enkel model werkt (nog) zoals we dat zouden willen.
Zoet: op diverse plekken bouwen verstandige collega’s aan modellen (zie vorige blog) en we hebben ze gisteren voor het eerst allemaal om één tafel gehad (bijna dan, er was 1 zieke); zuur: het zijn allemaal verschillende benaderingen die niet op elkaar aansluiten en op ieder moment weer afgebroken kunnen worden als de subsidie wordt stopgezet. Voorzichtige pogingen om te streven naar een Europese aanpak, waarbij iedereen een deel van het werk doet en je samen tot één model komt, leken gisteren nog niet vruchtbaar.
Het is dan ook ingewikkelde materie. De meeste modellen gaan uit van ‘activity-based costing’ (ABC): je benoemt welke activiteiten allemaal nodig zijn om ‘iets’ duurzaam toegankelijk te houden en je hangt er de benodigde menskracht/hardware/software aan. En als je nog een stap professioneler wil zijn, dan gebruik je de Balanced Score Card (BSC). Daarop zet je aan de ene kant je ambities als organisatie (wat wil je bereiken, in meetbare performance indicatoren) en aan de andere kant de kosten die je maakt voor diverse activiteiten. Je hoogste prioriteit mag het meeste kosten. Aan wat voor de missie van je organisatie minder of niet belangrijk is, besteed je geen geld. Die laatste stap heeft alleen een project gezet bij ons eigen data-archief DANS (Data Archiving and Networked Services), onder leiding van de Griekse econome Anna Palaiologk. (De resultaten daarvan zijn om auteursrechtelijke redenen nog onder embargo; publicatie gaat volgen). Toen Anna bij de KB op bezoek ging om te kijken of het model van DANS misschien ook toegepast kon worden op de KB, bleek dat er tussen die twee instellingen zal zulke enorme verschillen waren tussen de manier van werken, de manier van organiseren, de manier van kosten toerekenen, dat er geen beginnen aan was.
En dat is in een notendop ook het verhaal van gisteren: een algemeen model is ontzettend lastig te ontwikkelen – want iedereen is anders. e-Journals zijn heel andere dingen dan archiefstukken of onderzoeksgegevens (die per discipline trouwens ook weer behoorlijk blijken te verschillen) en ze vragen om andere inspanningen en een ander beheersregime. Audiovisuele bestanden zijn weer heel anders (Beeld en Geluid), en websites zijn helemaal een duveltjeuiteendigitaaldoosje. Omdat we bovendien nog weinig echte ervaringen hebben met digitaal materiaal waarop we onze schattingen kunnen baseren, en bovendien de technologie zich razendsnel ontwikkelt, is het lastig om voorspellingen te doen, zeker voor de lange termijn. Nog niemand kan voorspellen wat het bijvoorbeeld de KB gaat kosten als ze hun 16 miljoen PDF’s moeten migreren naar een ander bestandsformaat.
De vraag is wel of dat ooit nodig zal zijn. David Rosenthal van LOCKSS heeft daarover een uitgesproken mening, reden om ook hem uit te nodigen voor de bijeenkomst. Veel instellingen migreren de diverse bestandsformaten die ze aangeboden krijgen naar een beperkt aantal bestandsformaten bij binnenkomst (Portico, Nationaal Archief Denemarken). Dat maakt het beheer gemakkelijker, en het idee is ook dat je door toekomstbestendige formaten te kiezen later veel minder vaak zult hoeven migreren. Wat op termijn kosten en moeite bespaart. Maar al die extra inspanningen bij binnenkomst (‘ingest’) maken van de ingest verreweg de duurste fase van het hele duurzaamheidstraject, zo lijkt onderzoek uit de wijzen (LOCKSS, Keeping Research Data Safe). Momenteel wordt vrij algemeen de vuistregel geaccepteerd dat de ingest 40% tot 50% van de totale kosten veroorzaakt (migreren, checken, valideren, soms metadata toevoegen). Daarna vlakken de kosten snel af. Toegang kost ca. 30% van het totaal; opslag en duurzaam beheer is dus maar zo’n 19%.
David Rosenthal stelt nu dat het verhaal van Jeff Rothenberg (de duurzaamheidspionier van het iconische Ensuring the Longevity of Digital Documents uit 1995) niet meer opgaat. Rothenberg maakte zich vooral druk over het in onbruik raken van bestandsformaten en propageerde de noodzaak van emuleren en migreren. Rosenthal (van huis uit techneut) is van mening dat de bestandsformaten sinds 1995 behoorlijk stabiel zijn. Er komen er weliswaar bij, maar dat leidt niet (meer) tot het in onbruik raken van bestaande formaten. Dus zegt hij: stoppen met migreren, en zeker stoppen met migreren bij binnenkomst. Want je kunt toch niet voorzien wat de klant uiteindelijk nodig zal hebben. Het is beter om gewoon de bitstreams te bewaren en een migratietool te zetten tussen het archief en de uiteindelijke gebruiker, dus aan de achterkant van het proces. Dan lever je maatwerk (origineel of migratie) op het tijdstip en het platform waar de klant om vraagt. (En bespaar je je ook nog eens de moeite om die 90% te bewerken die nooit opgevraagd zal worden …). Onze Deense collega’s hoorden de theorie van Rosenthal met veel belangstelling aan, maar, zo zei Anders-Bo Nielsen van het Deense Nationaal Archief, voorlopig nemen we toch het zekere voor het onzekere en blijven we bij binnenkomst migreren. Want stel nou dat Rosenthal geen gelijk heeft? De collega’s van Beeld en Geluid vroegen het nog eens na bij David Rosenthal, want audiovisuele bestanden vragen waanzinnig veel geheugen en een migratie van 12 Petabyte aan audiovisuele data (=12x1024 terabyte! = de verwachting van Beeld en Geluid voor 2014) – daar zou je zomaar een nachtmerrie over kunnen krijgen. Ook zij zijn niet zomaar bereid een nationale collectie AV materiaal in de waagschaal te stellen voor een nog onbewezen theorie. En misschien is Rosenthal’s theorie ook alleen bruikbaar in zijn eigen domein, de e-journals, waar PDF-A ‘regeert’. [NB: in een mail aan mij maakte David Rosenthal bezwaar tegen deze laatste zinsnede; zie zijn reactie.]
Voorlopig zijn we er nog niet uit, dat is duidelijk. Maar het was weer een stap. Iedereen kent elkaar nu en kan gemakkelijker ervaringen en kennis uitwisselen, dat is alvast winst. Ik ga ook nog een formeel verslag schrijven van de bijeenkomst. En volgende week zetten we de gesprekken al weer voort, op de iPRES in Wenen, waar ook een sessie is gepland over kostenmodellen. Eens kijken of we daar een richting kunnen vinden om de lijnen weer aan elkaar te knopen. Tot volgende week.
Abonneren op:
Reacties posten (Atom)
Geen opmerkingen:
Een reactie posten