zaterdag 12 april 2008

(Gebrek aan) duurzaamheid in de praktijk



Een van de interessantste presentaties tijdens de Significant Properties conferentie van 7 april in London was voor mij die van Cal Lee van de altijd actieve School of Information and Library Science van de University of North Carolina (Cal hier rechts op de foto, naast Helen Hockx-Yu van Planets). Hij liet aan de hand van een voorbeeld uit de praktijk zien hoeveel moeite het kost om aan de hand van digitale documenten onze recente geschiedenis te reconstrueren. De onderzoeker kreeg de beschikking over de e-mail correspondentie uit het kantoor van Governor Hunt uit de periode 1997-2001. Het ging om zo'n 61.000 e-mails met 14 duizend bijlagen. Een greep uit de problemen die men tegenkwam:
- van de 41 accounts bleken er 5 besmet te zijn met virussen, o.a. het beroemde Kournikova virus;
- de bijlagen bestonden uit een grote diversiteit aan bestandsformaten en er waren diverse softwareversies gebruikt, die allemaal weer een eigen aanpak vragen;
- een flink aantal bestanden had een bestandsnaam die veel te lang was om door de onderzoekssoftware te komen;
en uiteindelijk het grootste probleem:
- de complexiteit van de Word-documenten die wij iedere dag in grote hoeveelheden produceren, met allerhande (vaak op het scherm verborgen) opmaakfaciliteiten, mogelijkheden om wijzigingen bij te houden, enz. enz., wat het allemaal niet gemakkelijk maakt om uit de enorme brij aan éénen en nullen de essentie ('significant properties') te halen. En ten slotte
- Microsoft geeft veel te weinig informatie over zijn software om deze problemen te kunnen oplossen; de gegeven algorithmes geven niet de oplossingen die men zoekt.


Lee's presentatie geeft maar weer aan hoe belangrijk het is om bij het maken van informatie al na te denken over aspecten van digitale duurzaamheid. Het devies blijft dus luiden: informatie die voor later van belang is nooit opslaan in Word, maar tenminste omzetten in PDF.

Foto: uit Nederland waren o.a. het Nationaal Archief, de Koninklijke Bibliotheek en de NCDD aanwezig.
(Foto's BL/JISC en DPC)

Geen opmerkingen: