maandag 20 september 2010

iPRES2010(2): website- en emailproblemen

DSC_0082Natuurlijk had ik het antwoord op de hamvraag aan het eind van de vorige blog goed (de vraag was dan ook bijzonder retorisch): Nee. One size does not fit all. Zeker niet bij webarchivering. Aardig was dat de International Internet Preservation Coalition (IIPC, netpreserve.org) een panel had georganiseerd met vertegenwoordigers van diverse webarchiveringsinitiatieven, foto vlnr Libor Coufal (Czech NL, Nationale Bib. Tsjechië), Gina Jones (LC, Library of Congres, US), David Pearson (NLA, Nationale Bib. Australie), Clementt Ouryl (BnF, Nationale Bib. Frankrijk) en Andrea Goethals (HUL, Harvard Univ. Library, US). Die kregen eerst de vraag voorgelegd waarom ze aan webarchivering doen (zie dia).DSC_0086

Uit de antwoorden blijken de nodige verschillen: de een collectioneert selectief, de ander probeert een heel domein te archiveren; een derde doet zelfs een combinatie van de twee (Tsjechië).

Vervolgens kwam de vraag wat de diverse organisaties doen om de inhoud te bewaren. Migratie? Emulatie? Nee, daar zijn we nog niet aan toe. Websites zijn complexe objecten, waar van alles in kan zitten: text, beelden, film, audio, simulaties, enz. Op zichzelf zijn dat bestanden waar we wel iets mee kunnen, maar in combinatie, en vooral op de schaalgrootte van webarchivering, dat kunnen we nog niet aan.  Dus bewaren we allemaal  zo goed mogelijk de bits (bit-level preservation), en wachten op betere tijden. Nouja, wachten is het ook weer niet, DSC_0042natuurlijk. Met name door IIPC-partners wordt allerlei onderzoek gedaan: identificeren van bestandsformaten (essentieel voor webarchivering), de specifieke eigenschappen van websites, en mogelijke duurzaamheids-strategieën. Adam Farquhar van de British Library (links vooraan met baard) besloot de discussie op filosofische wijze: problemen die nu heel groot lijken, zijn dat over tien jaar misschien helemaal  niet meer. Voorlopig die bits maar goed bewaren, lijkt het motto.

E-mails archiveren: zakelijke én persoonlijke informatie

DSC_0076 E-mails lijken wel een beetje op websites, rapporteerde Andrea Goethals van Harvard University Library (rechts in gesprek met Maurice van den Dobbelsteen van het Nationaal Archief): e-mails zijn ook dozen van Pandora waar (in de bijlagen) van alles in kan zitten. Daar komen nog weer andere problemen bij waar ikzelf eigenlijk nog nooit bij had stilgestaan: e-mails bevatten zowel gevoelige als niet-gevoelige informatie; zowel zakelijke als persoonlijke informatie – en die laatste is onderhevig aan allerlei privacy-wetten. Harvard heeft een beleid om sommige e-mails te bewaren als onderdeel van het wetenschappelijk proces (bijv. experimenten die niet gelukt zijn), maar zag zich genoodzaakt een project op te zetten met gescheiden openbaarheids- en duurzaamheidsregimes voor de beide soorten informatie. Alsof we nog niet genoeg te doen hadden ;-).

DSC_0038 (PS: En Wenen? ‘Eine richtige Altweibersommer’, hoor ik net op het nieuws, maar binnen merk je dat niet. Wel heerlijk gebak en gepaste muziek bij het ontbijt in dit Johan Strauss hotel, waar het wachtwoord van de nauwelijks werkende wifi ‘Musikfreunde’ is. Zelf ben ik meer een fan van Gustav Mahler, die hier ook de nodige sporen heeft achtergelaten. Ik zag een aankondiging van een tentoonstelling over Mahler en Wenen, met het citaat ‘Ich bin immer ein eingefleischter Wiener geblieben’ [oid]. Misschien heb ik later in de week nog een uurtje om erachter te komen wat dat betekent. Nu eerst proberen of de wifi deze blog wil meenemen. Anders moet die wachten tot morgenochtend, want op de Technische Universität Wien werkt de wifi wel; we hebben in Physikhörsaal 1 zelfs gas, water [Laborkühlwasser en de drinkbare variant] en elektra – die met veel verlengsnoeren geschikt wordt gemaakt voor de vele laptops.)

Geen opmerkingen: