woensdag 7 oktober 2009

iPRES (10): case studies en gereedschappen

De laatste middag van de iPRES is gewijd aan een hele serie presentaties over tools, gereedschappen, concrete case studies - sommigen van jullie zullen denken: eindelijk 'het echte werk' ;-). De afsluiter komt uit NederlanDSC_0406d: René van Horik van DANS met het MIXED project.

Technisch gaan de presentaties soms boven mijn pet; daar zijn andere bloggers beter in dan ik. Wat me opvalt is dat er veel aandacht in voor het authentiek opslaan van de data, de bit-stream preservering, en voor het opslaan van de nodige kopieën op andere plekken (systemen zoals LOCKSS). Wederom is het motto: als wij nu maar zorgen voor de eerste vijf jaar, dan zal de technologie van de toekomst de volgende stappen (migratie, emulatie, etc.) zetten.

Aan de orde komen o.a.: Chronopolis (datanetwerk met back-ups; Adrys Kozbial, UCSD Libraries); ContextMiner (een tool om het web te kunnen crawlen en zo collecties te vormen), iRODS (middleware voor gedistribueerde datanetwerken; Christopher Lee, University of North Carolina at Chapel Hill), software preservation (wat moet je allemaal wel niet bewaren om de software opnieuw te kunnen gebruiken; Esther Conway, University of York); de Preserv2 Registry (voor het linken van data en risico-analyse van digitale objecten; David Tarrant, University of Southhampton); onderzoek van Geoffrey Brown naar de problemen die je krijgt als je digitale bestanden probeert te openen maar niet beschikt over de originele fonts.

DSC_0408 Jens Ludwig uit Goettingen heeft met collega's binnen nestor een soort gids ontwikkeld om de ingest zoveel mogelijk te standaardiseren. Ingest is volgens onderzoek van Beagrie  de duurste fase van de duurzaamheid (zie NCDD-rapport), bovendien willen aanbieders graag simpele procedures en is de ingest een belangrijke kwaliteitsfactor. Het liefst zou je zo'n proces willen standaardiseren, maar dat is bijna niet te doen. Dus heeft nestor een soort gids ontwikkeld om het proces wel zoveel mogelijk te stroomlijnen (Wege ins Archiv: ein Leitfaden voor Informationsubernahme in das digitale Langzeitarchiv). Het eerste advies leidt tot gelach in de zaal: Gebruik geen OAIS terminologie - die snapt geen hond (natuurlijk moet je zelf wel OAIS hanteren, maar je moet het anders formuleren voor de aanbieders). Advies 2: 'Ingest' moet een overdracht van verantwoordelijkheid zijn, geen technische overdracht. Advies 3: deel het proces op in behapbare brokken. Probeer niet volledig te zijn, maar ga voor een praktische 'voldoende'. nestor is de handleiding nu aan het testen. Een project om in de gaten te houden!

Interessant: een vertegenwoordiger van LOCKS merkt op dat de studie van Beagrie en zijn conclusie dat de ingest 43% van de totale kosten uitmaken, wellicht achterhaald is, omdat de onderzochte instellingen verouderde methoden gebruikten. Jens: als je veel verschillende aanbieders van data hebt, dan blijft ingest een zeer bewerkelijke en dus dure fase. Dat is in Nederland ook de ervaring van DANS.

foto: Abbey Smith, redacteur van het rapport Sustaining the digital investment.

Geen opmerkingen: