maandag 19 oktober 2009

'Open access' aftrap voor digitaliseringscongres bibliotheken (LIBER 1)

BasOA Digitalisering, open access en wetenschappelijke bibliotheken: al die onderwerpen kwamen vanmiddag bij elkaar tijdens de opening van een driedaagse bijeenkomst van LIBER, de Europese organisatie van wetenschappelijke bibliotheken, over digitalisering van bibliotheekcollecties. Bas Savenije, directeur van de KB en bestuurslid van LIBER maakte geen geheim van zijn sympathie voor open access toen hij in toepasselijk oranje T-shirt het podium van de KB-aula besteeg; het is vandaag immers ook de eerste dag van de internationale open access week (Nederlandse website), waarvan o.a. ook SURF en DANS werk maken. (Zie voor Bas' pleidooi voor de green road zijn column in IP).

Met die open toegang tot bibliotheekcollecties valt het nog niet mee: de Europese Commissie berekende dat in 2008 nog slechts 2-3% van de collecties van nationale bibliotheken digitaal beschikbaar was - en die lopen dan nog een flink stuk voor op de wetenschappelijke bibliotheken. Vandaar dat deoaweek_header Europese Commissie een i2010 Digital Library initiatief heeft gelanceerd met een scala aan projecten. En toch blijft voorlopig de vraag hoe bibliotheken met beperkt publiek geld Grote-Broer-Met-Heel-Veel-Geld Google kunnen bijbenen en hun klanten publieke toegang kunnen blijven bieden tot gedigitaliseerde bronnen. Want dat is het probleem met private partijen: je weet nooit wanneer ze al die bronnen uit publiek bezit achter een wachtwoord gaan zetten. Europeana is het grootste Europese antwoord tot nu toe, een portal tot collecties van vele nationale bibliotheken en enkele wetenschappelijke. Maar is het genoeg?

Op deze conferentie hoor je trouwens weinig over duurzame toegankelijkheid. Dat is voor de meesten nog een brug te ver. De LIBER-organisatie zelf probeert er wel werk van te maken (door het LIFE-project en bijv. de 'Curating Research' workshop van afgelopen april in Den Haag), maar realiteit is duurzame toegankelijkheid voor veel wetenschappelijke bibliotheken nog niet. Eerst maar eens digitaliseren, dat is al moeilijk genoeg.

donderdag 15 oktober 2009

SURF onderzoeksdata forum (3): praktische vragen

polaryear Bij het forum waren twee concrete vragen binnengekomen, die als case studies worden voorgelegd. Dit is misschien wel de mooiste manier van kennisdelen en hopelijk met concreet nut voor zowel de aanvrager als het forum.

Ira van den Broek van het Koninklijk Nederlands Instituut voor Zeeonderzoek (NIOZ) presenteert de case Data management voor het International Polar Year (IPY). Het IPY is een enorm netwerk van grote en kleine projecten, waarvan Nederland er enkele voor zijn rekening nam (zie NWO website). Alle datasets uit die onderzoeken moeten nu gevonden, opgeslagen, geregistreerd en (in open access) gepubliceerd worden. En wel zo snel mogelijk, want over vijf jaar zien die polen er totaal anders uit en heb je er weinig meer aan.

Al die projecten hebben IT-toepassingen gebouwd, er is een oerwoud aan portals ontstaan, en men wil graag interoperabiliteit, maar ieder heeft weer 'zijn eigen standaard'. Wat moet Ira gaan doen: een data service ontwikkelen die via internet te benaderen is en die aan een aantal eisen voldoet (interface met GCMD portal, data opslag op 1 plaats, maar zo vindbaar mogelijk; footprint; data downloadbaar in ASCII, NetCDF, Excel; mogelijkheid tot downloaden; metadata harvesten via OAI-PMH; en er moet een diversiteit aan data inpassen). Moet Ira een nieuwe portal gaan bouwen?

rob Rob Grim van de Universiteit van Tilburg definieert data management als alles wat te maken heeft met opslag, archivering, doorzoekbaar en vindbaar maken van gegevens, het bieden van toegang tot gegevens en kennis over hoe wetenschappelijke gegevens aan de onderzoeker moeten worden aangeboden. Rob is data librarian en wil onderzoekers ondersteunen. Maar hij wordt nog weleens gehinderd door praktische zaken: bij de UvT heeft iedere onderzoeker bijvoorbeeld maar 250 MB (!) opslagruimte . . .

Rob signaleert dat we tot nu toe veel aandacht besteed hebben aan de infrastructuur, maar veel te weinig aan de services die daarop moeten draaien. Hij merkt op dat het belangrijk is om goed na te denken over de manier waarop we de data gaan presenteren om ze herbruikbaar te maken.

researchdata Hij presenteert de case van een denkbeeldige multidisciplinaire onderzoeksgroep die gegevens uit een bepaalde periode gezamenlijk wil gaan gebruiken en het resultaat wil publiceren. Hoe stel je een plan daarvoor op? Wat is je advies aan die onderzoeksgroep? Welke knelpunten signaleer je? Het forum heeft 40 minuten om deze vragen te beantwoorden ... Dat valt niet mee. Ook al omdat je in de praktijk natuurlijk naar maatwerk zoekt, doorvraagt wat de onderzoekers weten/kunnen/willen en daarop een datamanagementplan baseert. De adviezen van het forum komen dus vooral daarop neer: vraag door en door over zowel techniek als 'hergebruiksdoel' (is dat een Scrabblewoord?) als juridische zaken als, niet te vergeten, wat kost het en wie gaat er betalen? Ook belangrijk: goed afspreken wie precies waarvoor verantwoordelijk is.

Forumvoorzitter Wilma Mossink stelt tegen vijf uur de hamvraag: Heeft aanvrager Ira van den Broek iets aan de discussies gehad? In elk geval een bevestiging dat hij checklisten op wil gaan stellen om daarmee naar onderzoekers te gaan. En, benadrukt hij, we moeten ernaar streven als datacentra om ons werk helemaal aan het begin van het traject te starten, niet als een onderzoek eenmaal op gang is gekomen. Want dan heb je al veel kansen gemist.

SURF onderzoeksdata forum (2): 3TU.Datacentrum inventariseert wensen en eisen

3tu Jeroen Rombouts van het 3TU.datacentrum rapporteert over het onderzoek dat 3TU heeft gedaan naar de eisen die gesteld moeten worden aan een datacentrum, het is recentelijk gepubliceerd: Waardevolle data en diensten. Uitgangspunt was de vraag hoe dataproducenten gemotiveerd kunnen worden om mee te werken aan langetermijntoegang tot hun data -- want dat willen ze momenteel nog lang niet altijd, omdat het te veel werk is, omdat ze de data voor zichzelf willen houden, of om allerhande andere redenen (zie rapport). Het rapport bevat twee case studies, bij Darelux (die wel al doen aan centrale dataopslag) en Waterlab, de sectie Waterbouwkunde van Civiele Techniek en Geowetenschappen (CiTG), die nog niet aan dataopslag doen. Ook organiseerde 3TU een workshop met wetenschappers, die interessante input bood ('Wilt u dat het datacentrum rekencapaciteit moet hebben om data te analyseren? Nee, dat doen we liever zelf ...').

Het datacentrum maakte het voor DARELUX aantrekkelijk om data te deponeren door extra checks te doen die de kwaliteit van de data voor de onderzoekers verhoogden. Aan Waterlab bood 3TU automatisering van de metadatering aan. Allebei goede voorbeelden van methodes om de brug tussen archieven en producenten te slaan (een van de belangrijke knelpunten uit het NCDD-rapport Toekomst voor ons Digitaal Geheugen). Het rapport bevestigt dat er essentiële verschillen bestaan tussen soorten onderzoek, data en dataproducenten -- die generieke diensten moeilijk maken.

Standaardisering blijft sowieso een lastig punt. Sommige onderzoekers willen wel, anderen niet ('dat belemmert mijn onderzoek'). Het NIOO biedt onderzoekers een template aan om ze te helpen - voorlopig helemaal op vrijwillige basis.

De documenten staan op: http://www.datacentrum.3tu.nl (nieuws).

SURF onderzoeksdata forum (1): juridische aspecten

Op 15 oktober kwam het onderzoeksdata forum bijeen dat is opgericht door SURF om kennis en expertise te delen tussen alle organisaties die betrokken zijn bij het produceren, beheren en beschikbaarstellen van onderzoeksdata. Enkele highlights:

databankrecht Juridische status van onderzoeksdata. Allard Ringnalda van het Centrum Intellectueel Eigendomsrecht (CIER) gaf een inleiding over auteursrechtelijke aspecten van databeheer en  -gebruik, naar aanleiding van het verschijnen van het rapport De juridische status van onderzoeksdata.

Ruwe onderzoeksdata zitten vaak in een databank; volgens de wet is dat een verzameling zelfstandige elementen, die systematisch geordend zijn, en waarin een substantiële investering is gedaan. Het auteursrecht beschermt creativiteit; het databankenrecht beschermt de investering die een producent heeft gedaan om gegevens bij elkaar te brengen en te ordenen (de gegevens zelf zijn en blijven vrij). Vaak zijn de rechthebbenden financiers of universiteiten. Dat zijn dus de partijen die kunnen bepalen of de data in open access beschikbaar worden gesteld of niet. Soms is er sprake van gedeelde rechten. Dan wordt het echt ingewikkeld.  De twintig aanwezigen bestookten Allard met vele vragen; lees de brochure als je hiermee te maken krijgt.

donderdag 8 oktober 2009

IIPC (4): case studies organisatie webarchivering

Dit wordt de laatste sessie van drie lange en zeer nuttige conferentiedagen in San Francisco, met wederom een Nederlandse afsluiting: Hilde van Wijngaarden en Marcel Ras van de KB over het integreren van webarchivering in de KB-organisatie.

DSC_0558 Square pegs: fitting web archives into the digital preservation repository of the National Library of New Zealand, Kevin L. De Vorsey. In Nieuw Zeeland geldt alles dat wordt gepubliceerd in het .nz domein als 'publicatie' die valt onder de wettelijke depotregeling (dus ook deze tatoeage). De bibliotheek moet dus alles verzamelen en toegankelijk houden. Maar voor hoe lang? 'Voor zo lang als nodig' is de definitie. Is dat vijf jaar? 25 jaar? 1000 jaar? Eigenlijk doet dat er niet toe, zegt De Vorsey. Wij moeten de risico's managen die er nu zijn; de toekomst zal voor zichzelf zorgen. Maar het archief heeft het wel moeilijk gehad met het integreren van websites; die zijn veel complexer dan een .tiff of .pdf. De bibliotheek is nu zo ver dat men de websites kan archiveren, maar moet nog veel werk doen om de structuren van die informatie echt te doorgronden en op basis daarvan de juiste duurzaamheidsbeslissingen te nemen.

DSC_0560 Continuity and preservation: the National Archives approach to maintaining permanent access to the web presence of UK Central Government, Amanda Spencer and Alison Heatherington. Zelfs de politiek ging zich druk maken over webarchivering toen een minister de informatie die hij nodig had niet meer kon vinden op overheidswebsites; er waren te veel gebroken links. Dat is een mooie manier om aandacht te vragen voor het probleem, lijkt me! Het leidde ertoe dat in Engeland het hele overheidsdomein (zo'n 1500 websites) nu drie keer per jaar door de National Archives wordt geharvest. Ook helpt het NA de overheden met het implementeren van automatische verwijzingen naar het webarchief als links het niet meer doen.

DSC_0563 Gisterochtend begon de iPRES met een discussie over de economische kant van de zaak en de noodzaak om aan te tonen dat duurzaamheid nuttig is. Deze case van de UK National Archives lijkt me een mooi voorbeeld van hoe je ook direct nut kunt hebben, en niet alleen in die verre, verre toekomst. Dat kan het weer ietsje makkelijker maken om de nodige fondsen te werven.

Ik zie trouwens dat de NA vooralsnog uitgaat van migratie als duurzaamheidsstrategie, ook voor de websites. Het migratiegereedschap dat men gebruikt is 'Outside in' van Oracle. Maar ook dit is een 'work in process' en er zijn nog veel vragen over de metadata, over de risico's en over migratie. De workflows staan op de wiki van de IIPC, en de NA vragen uitdrukkelijk om feedback van het publiek.

Iemand uit het publiek merkt op dat de Engelse NA wellicht het eerste archief is dat echt werk gemaakt heeft van webarchivering. Amanda antwoordt dat de keuze ook binnen de NA niet onbesproken is. Menigeen vond dat websites eigenlijk publicaties zijn die niet thuishoren in een archief. Maar dDSC_0574e voorstanders wonnen.

It's the end of a project as we know it: a discussion on experiences and issues in embedding web archiving and preservation in an organization, Marcel Ras en Hilde van Wijngaarden, Koninklijke Bibliotheek; met Birgit Nordsmark Henriksen van de KB Kopenhagen en Gildas Illien van de BnF Parijs. De KB heeft een paneldiscussie georganiseerd met andere collega's die de projectfase van webarchivering voorbij zijn en nu een reguliere dienst hebben geïmplementeerd. Wat betekent zo'n overgang voor je organisatie? Marcel Ras geeft een overzicht van de taakverdeling binnen de KB (collecties selecteert; het e-Depot harvest en bewaart; en de afdeling publieksdiensten verzorgt de toegang). Bij de overgang van project naar dienst heeft hij een aantal problemen ervaren die allemaal te herleiden zijn tot een gebrek aan steun in de organisatie voor deze nieuwe dienst. En daarom is er te weinig IT-steun, te weinig expertise, en niet genoeg coördinatie tussen de betrokken afdelingen. Herkennen de andere deelnemers zulke problemen?

DSC_0540 Gildas Illien vertelt het verhaal van de BnF: de traditionele depotafdeling van 150 medewerkers was gericht op massaproductie. In 2007 is het webarchiveringsteam (3-4 fte) geïntegreerd in die afdeling, maar het blijft een team met een eigen identiteit. Ook hij meldt dat er meer betrokkenheid van IT en van het management nodig is.

DSC_0578 Birgit Nordsmark Hendriksen vertelt hoe de (analoge) depotbibliotheek van Denemarken volledig gekopieerd wordt in Aarhus. Er moeten altijd twee exemplaren worden gedeponeerd. Ten aanzien van webarchivering is er een taakverdeling gemaakt: in Kopenhagen worden de snapshots gemaakt en in Aarhus worden selecties en gebeurtenissen geharvest. Kopenhagen heeft de 'access copy' en Aarhus heeft het archiefexemplaar. Beide lokaties hebben IT-afdelingen. De R&D wordt in Aarhus verzorgd, terwijl Kopenhagen een digitaal duurzaamheidsteam heeft. Een stuurgroep overkoepelt op beide lokaties. De gebruikte software, NetarchiveSuite, werd ontwikkeld samen met de BnF en is beschikbaar in open source (http://netarchive.dk/suite/Development). De afdeling collecties vindt het nog wel lastig om in zo'n technische omgeving te werken, zeker omdat men maar een paar uur per week voor het webarchief werkt (alleen de service manager heeft een full-time baan). De verdeling over twee bibliotheken stelt hoge eisen aan de coördinatie, maar geeft ook veel mogelijkheden voor flexibiliteit. Men heeft behoefte aan meer gereedschappen, maar de andere problemen van de KB herkent Birgit niet zozeer.

DSC_0583 (2)

Het panel, vlnr: Marcel Ras, Birgit Nordsmark, Gildas Illien, en Hilde van Wijngaarden.

Moderator Hilde van Wijngaarden vraagt ook naar een aantal ervaringen in de zaal. Die blijken over het algemeen positief te zijn. Maar in de wandelgangen blijken de problemen van de KB ook elders voor te komen - alleen zeg je dat niet altijd in het publiek.

En dat is precies wat congresbezoek zo waardevol maakt: je hoort niet alleen de officiële versies, maar je kunt ook eens ronduit vragen: wérkt dat project van jullie ook echt? Na het tweede glas wijn krijg je vast een eerlijk antwoord. Niet om te publiceren, natuurlijk, maar wel om in de 'hoofdbagage' mee naar huis te nemen. Dat hoofd zit nu trouwens wel boordevol. Het is tijd om een dagje toerist te gaan spelen in San Francisco.

IIPC (3): organisatie van webarchivering

DSC_0535 What do web archivers (or is it archivists) really do? Gina Jones, Library of Congress. Wat is een 'internetarchivaris' en wat moet zo'n functionaris in huis  hebben? Omdat acquisitie een hoofdtaak is, moet je in elk geval weten wat er technisch allemaal mogelijk is in web crawls (en hoe je de zoekvragen goed definieert), je moet internet kennen (om precies te kunnen vinden wat je zoekt), je moet een collectieplan hebben, en je moet weten hoe je de gebiedsdeskundigen betrekt bij het proces. Aan de kant van de toegang moeten webarchivarissen  weten hoe gebruikers zoeken en welke gereedschappen ze hebben. De juiste metadata genereren is ook een kunst apart. Ten aanzien van het bewaren van websites moeten archivarissen weten wat er in de archieven zit om die goed te kunnen beheren. De eerste masteropleiding webarchivaris is inmiddels opgestart door de School of Information Science van de University of North Carolina.

DSC_0540 Let's talk! Organization schemes and metrics for preservation planning and management negotiation in web archiving institutions - Gildas Ilien, Bibl. nationale de France. (De titel is ingewikkeld en vaag, maar het gaat hier om communicatiestoornissen en prestatie-indicatoren.) In het digitale tijdperk hebben bibliothecarissen en IT-staf elkaar hard nodig, maar ze lijken soms wel een andere taal te spreken. Bibliothecarissen hebben het gevoel dat ze de controle over hun collecties kwijt zijn; IT-staf heeft weinig affiniteit met de inhoud. En het DSC_0544 management moet ervoor proberen te zorgen dat de twee kampen toch dicht genoeg bij elkaar komen om goed te kunnen samenwerken. De BnF heeft beide partijen in een aantal flinke workshops bij elkaar gezet om de hele workflow in detail te beschrijven. Daardoor werden verantwoordelijkheden verduidelijkt. Ook ten aanzien van vakjargon moest er het nodige worden opgehelderd. Dat hielp. Niettemin blijft het lastig om de schaal, de snelheid en het wereldwijde karakter van internet te vertalen in organisatorische voorzieningen en in eenheden waarmee je je prestaties kunt meten (metrics).

DSC_0551 Web archives are forever: defining a workflow for long-term preservation of web archives, Maureen Pennock, The British Library. De IIPC heeft een speciale digitale duurzaamheidswerkgroep die de workflow in kaart probeert te brengen nadat het oogsten voltooid is . De echte langetermijnbewaring, dus. Zo'n DSC_0553 workflow moet generiek toepasbaar zijn en moet continuïteit, consistentie en authenticiteit waarborgen. Gezien de hoeveelheden moet de workflow zoveel mogelijk geautomatiseerd zijn. Na analyse van bestaande documenten (van o.a. de BL, de BnF, de KB en de National Library of New Zealand) heeft de werkgroep een aantal flowcharts ontwikkeld die ik hier niet kan herhalen. Wie een webarchief wil inrichten, verwijs ik graag naar de werkgroep, de IIPC website waar de presentaties worden geplaatst, of naar Maureen.

woensdag 7 oktober 2009

IIPC (2): technische strategieën webarchivering

'Making more informed "guesses" about what works, David Pearson, National Library of Australia. Zo'n titel vermoedt een echt pragmatische aanpak, en bij de Australiërs ben je dan meestal in goede handen. In Australië wordt het hele .au domein vier keer per jaar geharvest in het Pandora webarchief. Van de 2.3 miljard files die daaruit zijn voortgekomen, is een klein deel nu al niet meer toegankelijk, omdat de file formats al weer verdwenen zijn. Wat kun je daaraan doen? Een beroep doen op file format registers (Pronom, UDFR, etc.)? Een beDSC_0514roep doen op Wikipedia? Documenteren wat de webarchieven hebben gebruikt/nu gebruiken? Daar komen hele lijsten met gebruikte software uit. Door die te vergelijken kun je beter inschatten wat er gebruikt zou kunnen zijn. Pearson vraagt leden van de IIPC of ze mee willen helpen om zulke lijsten te maken. Het blijft wel een beetje stil in de zaal ....

'Here be dragons', strategies for dealing with virusees in the web archive, Matt Holden, Institut National de l'Audiovisuel). Holden wil de virussen niet helemaal uit het webarchief houden, want ze zijn een stuk historie, maar je wilt natuurlijk niet dat ze het hele archief infecteren. Hij acht het risico bij het oogsten van websites klein, want dan wordt er van alles gecheckt. Bij het opvragen is het risico veel groter. Dan moet je niet alleen het archief beschermen, maar ook de PC van de gebruiker. Beschikbare tools zijn ClamAV, Dazuko en HAVP. De strategie van INA bestaat uit: regelmatige viruschecks in het archief en regelmatige checks van het dataverkeer tussen het archief en de gebruiker. - Bij tests bleek het archief 2458 virussen te bevatten (28 unieke), 1 virus per 50,000 files. Exploit & Iframe zijn de meest voorkomende virustypes. Als de lezer weet wat dit betekent, weet hij meer dan ik ;-). De conclusie is dat de virussen een relatief laag risico zijn voor het webarchief. Maar ja, eentje kan te veel zijn ....

Duurzaamheidsstrategieën: emulatie of migratie?

DSC_0528 'I say emulate; he says migrate', David Pearson, National Library of Australia (rechts) en Jeffrey van der Hoeven van de KB namens het KEEP project. Hoe gaan we duurzaamheid waarborgen? Dat is een tak van sport die nog in de kinderschoenen staat. Want er zit van alles in websites, tekst, databases, beelden, video, etc. etc. Wat je gaat bewaren en welke eigenschappen je belangrijk vindt, hangt af van de doelstelling van de de bewarende organisatie.

Mogelijke duurzaamheidsstrategieën zijn migratie (omzetten van bestanden naar steeds nieuwe software) en emulatie (een nieuwe computer door middel van software laten functioneren als een oude computer). Je kunt natuurlijk ook proberen de oude computers te bewaren (computermuseum), maar dat spoor zal snel doodlopen als die computers niet meer onderhouden kunnen worden. En wie weet 50 jaar later nog hoe die computers werkten?

De National Library of Australië deed een serie tests met zowel emulatie (Dioscuri) als migratie. Bij emulatie kreeg men vooral problemen met: a) allerhande licenties op software; b) de vele onderlinge afhankelijkheden tussen de gebruikte programma's. Maar aan het eind kwamen de meeste objecten er goed genoeg uit. Migratie vereiste zeer snelle dataverbindingen, en de beschikbare tools zijn niet perfect en nogal langzaam. En het is moeilijk om goede beslissingen te nemen als je niet weet wat het exacte doel van de beschikbaarstelling is. Al met al concludeerde Australië dat de belangrijkste vraag nog niet is beantwoord: wat willen we precies bewaren? Waavoor bewaren we precies? Er zijn verder te weinig tools, en de tools die er zijn, moeten nog verder ontwikkeld worden. Vooral bij grote hoeveelheden data werken ze slecht.

Jeffrey van der Hoeven van KB presenteert het KEEP project: Keeping Emulation Environments Portable. Jeffrey laat zien hoe snel het gaat met de veranderingen in de software die we gebruiken. De laatste browser is Google Chrome 2009, dat op de markt wordt gebracht onder het motto 'not your mother's JavaScript'. Complex, dus. Ook de functionaliteit van websites is in vijftien jaar tijd enorm vooruitgegaan. Om de websites te gebruiken hebben we steeds meer software nodig (plug-ins, fonts, video). En waar websites nog wel compatibel kunnen zijn, zijn de browsers dat vaak niet.

DSC_0522 Van der Hoeven zegt direct: emulatie is niet DE oplossing, maar voor complexe websites zou het weleens de enige oplossing kunnen zijn. De KB en het NA hebben er veel onderzoek naar gedaan en o.a. Dioscuri ontwikkeld. Maar, geeft Jeffrey toe, we zijn er nog niet. Een emulator is een complex systeem dat alleen door 'techies' kan worden gebruikt. Ook heb je de oude software nodig (licenties!). En wie weet nog precies hoe die oude programma's werkten?

KEEP is een Europees project dat erop is gericht het makkelijker te maken data over te zetten van oude dragers op nieuwe; duurzaamheid te bevorderen; en de emulatie onafhankelijk te maken van een sDSC_0519pecifiek computerplatform. Het project loopt van 2009 tot 2012. Jeffrey vraagt het publiek om mee te helpen ontwikkelen aan een goed emulatieplatform. Daar kan ik weinig aan bijdragen. Maar ik heb wel een advies voor komende projecten: het is aardig als een acronyiem lekker klinkt (KEEP), maar als het vervolgens volstrekt onduidelijk wordt waar het om gaat, dan ben je je doel toch wel een beetje voorbijgeschoten.

DSC_0531 David Rosenthal van LOCKSS vindt KEEP een interessant project, maar hij denkt dat het makkelijker kan. Als je de meest gebruikte browsers inbouwt in de pijplijn tussen het archief en de gebruiker, dan zou je al veel oplossen. LOCKSS kiest voor het bewaren van de bitstream; eventuele migratie geschiedt op het moment van opvragen, 'on the fly'. Ook denkt David dat het wel zal meevallen met het in onbruik raken van file formats. Zijns inziens zal dat veel langzamer gaan dan soms gesuggereerd. Hier schiet mijn technische kennis tekort ...

Iemand uit het publiek vraagt waar Australië nu voor zou kiezen, migratie of emulatie. David's antwoord: 'personally I think migration ... or emulation.' Men is er nog niet uit. Anderen vragen hoe lang het zal duren voordat we emulatie of migratie echt moeten gaan inzetten. Jeffrey geeft aan dat er nu al content verloren gaat. Maar misschien kunnen we dat ook accepteren, voegt David toe.

Ten slotte vragen Jeffrey van der Hoeven en Hilde van Wijngaarden van de KB andere organisaties om mee te helpen ontwikkelen aan emulatietechnieken.

IIPC (1): hoe zorgen we voor duurzame toegang tot informatie op internet?

De International Internet Preservation Consortium is de organisator van een bijeenkomst (wederom hier in zonnig San Francisco) getiteld 'Active solutions for preserving internet content'. Ik ben hier aangeschoven omdat ik nog te weinig van dit onderwerp weet. Dus reken op elementaire informatie in deze blog ;-). Het probleem is duidelijk: er is zo veel aanbod, het is zo divers, het is allemaal dynamisch, verandert met de dag, begint en verdwijnt weer. Wat moeten we daarvan bewaren en hoe gaan we dat aanpakken?

DSC_0480 Brewster Kahle van het Internet Archive. De toon wordt (om half negen!) gezet door Brewster Kahle van het Internet Archive: ja, er gebeurt van alles sinds de IIPC in 2003 werd opgericht, maar: we moeten nog veel meer doen - en om die boodschap kracht bij te zetten gebruikt Kahle zijn hele lichaam (foto). Het Internet Archive is in 1996 begonnen met het archiveren van "snapshots" van websites om de twee maanden. Dat is een oppervlakkige manier van oogsten: het zichtbare plaatje, zonder alle links waar naar verwezen wordt te volgen. Er zitten nu 150 miljard pagina's in het archief en er komen er nu iedere maand 4 miljard bij. Mijn hemel! Kahle benadrukt hoeveel stroom dat allemaal kost. Daar denken we niet altijd bij na ;-).

Kahle propageert het maken van kopieën en die elders (en in verschillende systemen) onderbrengen als belangrijkste duurzaamheidsstrategie - net als de meesten gisteren tijdens de iPRES. Maar verder gaat het vooral om de missie om 'universal access to all knowledge' te bewerkstelligen - en de rol die uitgevers, bibliotheken en het internet daarin hebben. Dat is een apart verhaal.

DSC_0490 Library of Congress: 'Billions and billions of objects, METS, PREMIS, oh my!' - Gina Jones. Het gevoel dat in deze titel zit, is denk ik heel herkenbaar. De Library of Congress heeft gekozen voor het archiveren van een aantal thematische collecties, zoals in Nederland de KB nu ook doet. Alle 124 TB is volledig beschikbaar via de website. Er worden MODS metadata aan gehangen, en de catalogiseerders van de LoC voegen LoC subject headings toe. Het 'crawlen' wordt verzorgd door het Internet Archive. Sinds 2007 verzorgt het Internet Archive ook een back-upfunctie. Voor het transporteren van data gebruikt de LoC de BagIt-tool, die de California Digital Library (met steun van NDIIPP) heeft ontwikkeld. Er zijn ook onbeantwoorde vragen: welk deel van dit archief moet de LoC echt duurzaam gaan bewaren? En hoe moet men dat gaan doen, via emulatie of migratie? Wat voor metadata is ervoor nodig om de inhoud ook over 10 of 20 jaar begrijpelijk te houden? (ps: Jones zegt verder niks over METS of PREMIS, zoals de titel had beloofd ...).

WARC format and beyond (John Kunze, California Digital Library; met input van afwezige Mark Middleton, Hanzo Archives Ltd (een commerciële aanbieder van webarchiefdiensten voor bedrijven in de VS); Clément Oury, Bibliothèque nationale de France). WARC = ISO 28500 = Web ARChive file format; ontwikkeld door IIPC, opvolger van het ARC file format. WARC = "a sequence of content blocks, each preceded by a small text header; allows easy recording of content blocks; WARC supports related content blocks (wat ARC niet kon)." Voor de liefhebbers is hier de uitgebreide website. Wanneer je websites binnenhaalt ('crawlt'), zo leer ik, krijg je enorme hoeveelheden kleine files, en dat kan nogal irritant zijn. DSC_0499Met WARC kun je files clusteren tot grotere eenheden die gemakkelijker te managen zijn ('blikken' informatie, zie illustratie). Middleton vertelt (via John Kunze) over een aantal gereedschappen die zijn ontwikkeld om met WARC te werken en om oude ARC- files om te zetten in WARC. Alles is open source en beschikbaar via http://code.google.com/p/warc-tools. Oury en collega's onderzochten het gebruik van WARC. Iedereen was enthousiast toen de standaard op de markt kwam, dus waarom heeft nog bijna niemand hem inmiddels geïmplementeerd? WARC blijkt toch best wel complexer te zijn dan ARC was. Je kunt er ook meer mee, maar dat heeft een prijs. Instellingen ervaren de transitie ook een beetje als een sprong in het duister: hoeveel tijd en inspanning gaat het kosten? Dus heeft de IIPC een task force gevormd om richtlijnen voor de implementatie te formuleren.

DSC_0474

PS: live blog met dank aan mijn achterbuurman James Jacobs van Stanford University Library, die internationale vriendschappen sluit door met grote blokken stopcontacten op conferenties te verschijnen; zelfs mijn enorme internationale stekker (in wit op de voorgrond), die gisteren en eergisteren  niet op de zaalstopcontacten paste, mag zich laven aan de geboden vriendelijke energie!

iPRES (11): Nederlandse bijdrage, DANS MIXED

DSC_0460 De allerlaatste spreker van de conferentie is de eerste Nederlander die aan het woord komt tijdens deze iPRES 2009: René van Horik van DANS die het DANS MIXED project presenteert. Omdat DANS veel oude data-archieven heeft overgenomen, heeft het te maken met veel bestandsformaten, waarvan er ook al een aantal in onbruik zijn geraakt. Het gaat met name om databases. De strategie die DANS nu ontwikkelt, is om al die content om te zetten in een 'intermediate XML-formaat' en dat te archiveren. Wanneer het object wordt opgevraagd, wordt die intermediate XML weer omgezet in een dan geldend bestandsformaat. DANS noemt dit systeem 'smart migration', slimme migratie.

DSC_0464 Uitgangspunt van de hele methodiek is dat XML een duurzaam formaat is. Het ontwikkelen van alle 'convertors', zowel aan de ingest kant als aan de toegangskant, is een arbeidsintensieve klus. René beëindigde zijn presentatie dan ook met een oproep aan de duurzaamheidscollega's om mee te werken aan het opbouwen van dit gereedschap. Hoewel het de laatste presentatie van de dag was, bleef het publiek alert en er kwamen de nodige vragen aan René. En niet van de minsteDSC_0451n. In het publiek o.a. Chris Rusbridge van de DCC, David Rosenthal van LOCKSS, Stephen Abrams van de California Digital Library en vele anderen.

En toen was het allemaal afgelopen. Hoewel: als zoveel experts bij elkaar zijn, moet je daar gebruik van maken en dus zijn er een aantal conferenties en workshops aan vastgeknoopt. Ik  ga morgen naar de meeting van de International Internet Preservation Coalition. Met mijn netbook, uiteraard.

iPRES (10): case studies en gereedschappen

De laatste middag van de iPRES is gewijd aan een hele serie presentaties over tools, gereedschappen, concrete case studies - sommigen van jullie zullen denken: eindelijk 'het echte werk' ;-). De afsluiter komt uit NederlanDSC_0406d: René van Horik van DANS met het MIXED project.

Technisch gaan de presentaties soms boven mijn pet; daar zijn andere bloggers beter in dan ik. Wat me opvalt is dat er veel aandacht in voor het authentiek opslaan van de data, de bit-stream preservering, en voor het opslaan van de nodige kopieën op andere plekken (systemen zoals LOCKSS). Wederom is het motto: als wij nu maar zorgen voor de eerste vijf jaar, dan zal de technologie van de toekomst de volgende stappen (migratie, emulatie, etc.) zetten.

Aan de orde komen o.a.: Chronopolis (datanetwerk met back-ups; Adrys Kozbial, UCSD Libraries); ContextMiner (een tool om het web te kunnen crawlen en zo collecties te vormen), iRODS (middleware voor gedistribueerde datanetwerken; Christopher Lee, University of North Carolina at Chapel Hill), software preservation (wat moet je allemaal wel niet bewaren om de software opnieuw te kunnen gebruiken; Esther Conway, University of York); de Preserv2 Registry (voor het linken van data en risico-analyse van digitale objecten; David Tarrant, University of Southhampton); onderzoek van Geoffrey Brown naar de problemen die je krijgt als je digitale bestanden probeert te openen maar niet beschikt over de originele fonts.

DSC_0408 Jens Ludwig uit Goettingen heeft met collega's binnen nestor een soort gids ontwikkeld om de ingest zoveel mogelijk te standaardiseren. Ingest is volgens onderzoek van Beagrie  de duurste fase van de duurzaamheid (zie NCDD-rapport), bovendien willen aanbieders graag simpele procedures en is de ingest een belangrijke kwaliteitsfactor. Het liefst zou je zo'n proces willen standaardiseren, maar dat is bijna niet te doen. Dus heeft nestor een soort gids ontwikkeld om het proces wel zoveel mogelijk te stroomlijnen (Wege ins Archiv: ein Leitfaden voor Informationsubernahme in das digitale Langzeitarchiv). Het eerste advies leidt tot gelach in de zaal: Gebruik geen OAIS terminologie - die snapt geen hond (natuurlijk moet je zelf wel OAIS hanteren, maar je moet het anders formuleren voor de aanbieders). Advies 2: 'Ingest' moet een overdracht van verantwoordelijkheid zijn, geen technische overdracht. Advies 3: deel het proces op in behapbare brokken. Probeer niet volledig te zijn, maar ga voor een praktische 'voldoende'. nestor is de handleiding nu aan het testen. Een project om in de gaten te houden!

Interessant: een vertegenwoordiger van LOCKS merkt op dat de studie van Beagrie en zijn conclusie dat de ingest 43% van de totale kosten uitmaken, wellicht achterhaald is, omdat de onderzochte instellingen verouderde methoden gebruikten. Jens: als je veel verschillende aanbieders van data hebt, dan blijft ingest een zeer bewerkelijke en dus dure fase. Dat is in Nederland ook de ervaring van DANS.

foto: Abbey Smith, redacteur van het rapport Sustaining the digital investment.

dinsdag 6 oktober 2009

iPRES(9): Samenwerken

DSC_0430 Drie heel verschillende presentaties vanochtend (Micah Altman over onderzoeksdata; Martha Anderson (foto rechts) over de Amerikaanse collega van de NCDD NDIIPP en een panel over gedistribueerde opslag van digitale objecten) en toch komt er een rode draad bovendrijven die helemaal niet nieuw is, maar wel weer extra wordt aangezet: het probleem van duurzame toegankelijkheid is een probleem van samenwerkingsdynamiek. Niemand kan dit meer alleen doen, we moeten samenwerken, maar daar zijn we van nature niet zo goed in, dus moeten we daar systematisch aan werken. NDIIPP heeft daar al van het begin van de organisatie veel aandacht aan besteed. Dat is ook wel een beetje de aard van Martha "we are a people's network" Anderson, en wij Nederlanders zijn er vaak te nuchter voor om daar echt voor te gaan zitten (al dat softe gedoe), maar er is genoeg research die aantoont dat als je de dynamiek van samenwerking snapt, en waarom die soms maar niet van de grond lijkt te komen, dat je dan als samenwerkingsorganisatie effectiever je werk kunt doen. Als ik de geschiedenis van NDIIPP door Martha hoor vertellen, dan hoor ik een gestage stap-voor-stap aanpak: idDSC_0432entificeren wie er in het netwerk actief zijn; bepalen wat hun rollen en belangen zijn; samenwerken in wat losse projecten; en nu de stap die NDIIPP de komende jaren wil zetten: het omzetten van een vrijblijvend netwerk in een formeel 'Digital Stewardship Network', waar een charter onder ligt waar handtekeningen op staan. Daar heeft men zeven jaar over gedaan. Over een van de criticasters van NDIIPP, die riep en roept dat NDIIPP een centraal digitaal duurzaamheidssysteem moet bouwen (Henry Gladney), zegt Martha: "Hey, this is America. People just won't accept that" - en die opmerking zou ook wel eens van toepassing kunnen zijn op de Nederlandse poldermentaliteit.

Liz Bishoff, die een eigen PLN (private local network) heeft opgezet in het LOCKSS systeem, verwoordde het net zo: als we naar duurzame toegankelijkheid kijken, dan is de technologie de zichtbare top van de ijsberg; onder water, en veel omvangrijker, zitten de uitdagingen op het gebied van organisatie en continuiteit. 'And we need to get into our wet suits, folks!'

iPRES (8): live from San Francisco

Collega I.K. te 's H. verzocht mij om vooral te bloggen vanaf de iPRES in San Francisco. Welnu, terwijl jullie allemaal lagen te slapen, heb ik deDSC_0336 hele dag live meegeschreven. Jullie hoeven weinig te missen.

Maar nu is de batterij leeg (letterlijk en figuurlijk). Het is SF borreltijd.

Tot morgen!

iPRES (7): nestor wordt staande organisatie

DSC_0245 De Duitse collega van de NCDD, het nestor netwerk, heeft een eerste projectfase afgesloten en Sabine Schrimpf vertelt hoe de organisatie nu verder gaat: een beetje zoals de NCDD, gesponsord door leden. Het doel van nestor blijft kennis en expertise te verspreiden, maar er is een nieuw doel aan toegevoegd: "thus, nestor is the starting point of a preservation network". Dat is nog net geen infrastructuur, maar het gaat wel die kant op. Men vraagt van lid-organisaties om specifieke taken op zich te nemen en daarvoor echt verantwoordelijk te zijn. Dat lijkt een beetje op de insteek van NDIIPP in de VS (waar we morgen meer over horen). Dat is niet helemaal toevallig, want Sabine heeft enkele maanden stage gelopen bij NDIIPP.

Een mooi citaat van Sabine: "Individual partners outshine the network" - en daar moet toch meer balans in komen als nestor als bundeling van krachten met name meer politieke invloed wil krijgen. De financiele basis van het nieuwe nestorr is ook nog niet sterk genoeg. Dat lijkt allemaal heel erg op de NCDD ...

foto: de gevel staat; de duurzaamheid zal blijken (Sausalito)

iPRES (6): de kosten, een horizon van 5 tot 10 jaar, en een tegengeluid ten aanzien van selectie

In Engeland loopt al enkele jaren het LIFE project, dat erop gericht is de kosten voor duurzame toegankelijkheid te leren begroten. Paul Wheatley van de British Library vertelt over dit project, terwijl mijn buurman in de zaal, Steve Knight van de National Archives van New Zealand mompelt: hier geloof ik dus niks van. We kunnen niet verder dan een paar jaar vooruitkijken. Daarna zal de techniek zo geëvalueerd zijn dat we met totaal andere maatstaven gaan meten.'

Altijd een onafhankDSC_0052elijke denker, die Steve. Hij is een van de weinige archivarissen die blijft roepen dat we ALLES moeten bewaren. Hij vindt het van weinig vertrouwen in de toekomst getuigt als we nu al gaan selecteren wat we wel en niet moeten bewaren. Hij ziet onze huidige opgave als vooral zoveel mogelijk materiaal verzamelen dat anders voor altijd verloren is. Omdat we weten dat de techniek zich snel ontwikkelt, zullen de volgende generaties ervoor zorgen dat die hoeveelheden altijd toegankelijk blijven.

Dat hoor ik trouwens vaker vandaag: 'forever is five to ten years' - met andere woorden: als wij er nu maar voor zorgen dat het materiaal de komende vijf tot tien jaar overleeft, dan zal de techniek die dan ontwikkeld is de volgende stappen wel zetten.

maandag 5 oktober 2009

iPRES (5): infrastructuren

DSC_0034 Helaas kon ik niet overal zijn vanmiddag, dus koos ik voor de parallelsessie infrastructuren.

De eerste spreker: Reinhard Altenhoener van Gottingen University Library met een lezing over een "national infrastructure for digital preservation" in Duitsland. Al snel wordt duidelijk dat deze nationale aanpak alleen de wetenschap betreft. Helaas biedt Reinhard vooral een lange lijst van problemen die we nog niet hebben opgelost en een lange to-do lijst. Heel herkenbaar, maar het voegt weinig toe aan de lijst die in het NCDD rapport staat.

Opmerkelijk: Reinhard vindt dat er in Duitsland momenteel genoeg aandacht is ontstaan voor het onderwerp e-infrastructuur. Daar denken we in Nederland toch wel anders over.

DSC_0392 En nu de beroemde Stephen Abrams van de California Digital Library. 'An emergent micro-services approach to digital curation infrastructure.' Het uitgangspunt: de huidige infrastructuur is verouderd, we moeten iets nieuws verzinnen. Er is sprake van 'more stuff, smaller budget'. Wat ik ervan meekrijg is dat men vooral zoekt naar kleine eenheden met specifieke taken, die ieder voor zich gemakkelijker en goedkoper te ontwikkelen en onderhouden zijn, en die toch met elkaar een systeem vormen. Dan wordt het erg technisch ... dat blog ik niet bij. Maar na een vraag van David Giaretta wordt me duidelijk dat de intentie hier hetzelfde is als bij het iRODS project. Alleen gaat men hier uit van volledig zelfstandige eenheden die ook een geheel vormen.

En vervolgens naar Canada. Daar zijn de nationale bibliotheek en het nationaal archief vijf jaar geleden gefuseerd. De lezing (van Pam Armstrong en Johanna Smith) gaat over overheidsdocumenten. Ook in Canada was de overheidsinformatiehuishouding niet op orde, wat in 2003 leidde tot een vernietigend rapport en de nodige regels voor records management. Men denkt daar nu aan een centrale opslag voor overheidsdocumenten, wat het oogsten door Library and Archives Canada zal ondersteunen. Ook heeft men regels opgelegd en gereedschappen ontwikkeld om het gemakkelijker te maken te archiveren. Ik vraag me natuurlijk direct af hoe succesvol al deze inspanningen zijn. Daarop volgt niet meteen antwoord ... Dit blijkt het eerste jaar te zijn van een project dat vijf jaar gaat duren.

Robert Sharpe van Tessella presenteert het EU Planets project. Wie daar alles van wil weten moet 14 december naar Den Haag komen (zie http://www.ncdd.nl). Het onderdeel dat hier aandacht krijgt is een online enquete van Planets om te beoordelen in welke mate instellingen duurzaam beleid en een duurzame organisatie hebben. De conclusies zijn gebaseerd op 200 antwoorden van organisaties uit de Planets achterban. Dus is het niet vreemd dat 93% aangeeft dat men zich bewust is van het probleem. Maar daarvan heeft 52% nog geen duurzaamheidsbeleid. 85% van de respondenten zeggen dat ze een oplossing hebben, of daarmee bezig zijn. 77% gaat binnen 2 jaar geld investeren. Men verwacht, en dat is opmerkelijk, vooral "plug-and-play" gereedschappen aan te kopen. Dus geen oplossingen waaraan men zelf nog veel moet ontwikkelen. Als ik zo hoor wat bijvoorbeeld de KB en het NA zelf moeten doen aan de ontwikkeling van hun digitale archieven, lijkt die verwachting me redelijk onrealistisch, in ieder geval op dit moment.

Een slimme vragensteller stelt dat dit een onderzoek lijkt onder "early adopters". Die zijn het probleem niet in ons vakgebied. Het echte probleem zit bij al die individuen en organisaties die "in the mainstream" zitten en zich nog nauwelijks bewust zijn van het probleem. Waarvan akte!

iPRES (4): hoe belangrijk zijn virtuele werelden?

Henry Lowood van Stanford University presenteerde het project dat hij heeft opgezet om virtuele werelden als Second Life te archiveren. Zo'n project roept interessante vragen op: hoe echt is een virtuele wereld? Wat zegt zo'n wereld over onze cultuur? En wat moet je bewaren om er later iets over te weten te komen? De software is niet genoeg, je hebt ook allerhande data nodig over wat spelers van games gedaan hebben.

Aardige quote: "het eind van de wereld wordt geen big bang, maar een simpele "network error; server has shut down." En dan is alles foetsie ...

Aan de andere kant roept Henry's lezing bij mij de vraag op of we nu echt niet te ver gaan in onze bewaardrift. Moeten we echt alles bewaren? Wat levert dat alles later op?

En ja, terug naar Martha Anderson: die massa, die complexiteit, we zullen nog heel wat werk moeten verzetten voordat we daar vat op krijgen!

Live uit SF waar (buiten) de zon welig schijnt, de pelikanen in de baai duiken om vis te happen en aanwaaiende zeehonden bijna een plaag worden op Fisherman's Wharf.

iPRES (3): duurzaamheid is ook economische kwestie

DSC_0357 Een aantal maanden geleden heeft een Blue Ribbon Taskforce een prima interimrapport opgeleverd: Sustaining the digital investment (zie eerdere blog off google de titel), over de economische kant van duurzame toegankelijkheid. Een aantal van de auteurs zitten vandaag op het podium van de iPRES om over het rapport te discussiëren: vlnr: Patricia Cruse (University of California repository), Abby Smith Rumsey, redacteur van het rapport; Paul Courant, een econoom, Martha Anderson (NDIIPP), Brain Lavoie (OCLC).

Vergeet niet dat 'duurzaamheid' niet alleen een technische zaak is, maar ook een kwestie van financiering en economie, benadrukte Brian Lavoie in zijn introductie. De task force formuleerde vijf eisen waar economische duurzaamheid aan moet voldoen:

  • het nut moet erkend worden (de vraagkant)
  • bestuurders moeten gemotiveerd worden om in actie te komen (aanbodkant)
  • selectie!
  • mechanismen om continue, efficiente toedeling van financiele middelen mogelijk te maken;
  • goede organisatie en bestuurlijke verankering.

DSC_0373 In de discussie benaderden diverse panelleden dat het langetermijnperspectief nauwelijks 'verkoopt'. Op de een of andere manier moeten we het probleem dichterbij brengen: het gaat niet om duurzaamheid maar de DINGEN die we bewaren; benadruk het nut dat objecten NU kunnen hebben, bijvoorbeeld voor onderwijs en onderzoek - dat argument doet wonderen bij het Amerikaanse Congress, vertelde Martha Anderson (NDIIPP).

Paul Courant, een econoom, had voor het publiek een ontnuchterende opmerking: 'Behalve de 300 mensen in deze zaal geeft geen mens om duurzaamheid." We staan weer met beide benen op de grond!

DSC_0074 Martha Anderson benadrukte dat de problematiek waar bewarende instellingen voor staan in feite teruggebracht kan worden tot twee kwesties: omgaan met de HOEVEELHEID en de COMPLEXITEIT.

Hoe breng je vraag en aanbod bij elkaar, vroeg Smith. Courant benadrukte dat we  de spelregels zo veel mogelijk in een formeel kader moeten onderbrengen, en wel een SERIEUS kader, waarin op naleving wordt gecontroleerd.

Tot zover live uit San Francisco; excuses voor typfoutjes.

foto midden: netwerken; foto onder: economie in China Town.

iPRES (2): archieven van bedrijven

DSC_0352 De opening van de iPRES is zeer Amerikaans: David A. Kirsch beijvert zich er al een aantal jaren voor om de archieven van bedrijven te redden. Bedrijven hebben immers een grote invloed op de samenleving en de geschiedenis van de samenleving, en zelf vernietigen zij hun eigen archieven het liefst zodra de kosten de baten te boven gaan. Zijn stelling: de samenleving kan er baat bij hebben die archieven te bewaren voor de geschiedschrijving. Iets om over na te denken.

DSC_0368

foto: het KB e-Depot is hier goed vertegenwoordigd en netwerkt tijdens de lunch. Buiten in het zonnetje ...

vrijdag 2 oktober 2009

iPRES (1)

san-francisco-weather

'Bofkont!' mailde collega R.G. te T. toen hij hoorde dat ik morgenvroeg naar San Francisco vlieg voor de iPRES conferentie. En dat ben ik natuurlijk - tenminste, zodra ik die elf uur opgepropt in het vliegtuig heb overleefd. Zon, zee, palmbomen, Scott McKenzie's evergreen in het achterhoofd, dat kan niet meer stuk.

Hard werken wordt het ook. Van 's ochtends vroeg tot 's avonds laat in touw, zoveel mogelijk mensen spreken, zoveel mogelijk proberen te 'oogsten' aan informatie en ideeën.

En dan toch weer de helft moeten missen vanwege het fenomeen parallelsessies. Waarom zetten ze altijd sessies die ik hoog op mijn lijstje heb staan tegenover elkaar? Links een interessant Canadees project dat echt werk maakt van samenwerking met dataproducenten (een van de grootste uitdagingen waar we voor staan), en rechts het project TIPR, dat verschillende soorten repositories met elkaar wil laten samenwerken. Onmogelijke keuze, natuurlijk.

scottmckenzie Bij voorbaat ingepland is de 'krijgsraad' met de collega's van de Engelse Digital Preservation Coalition en het Amerikaanse NDIIPP - NDIIPP maakt vorderingen met een ´stewardship charter´ waar ik alles van wil weten.

'If you're going to San Francisco, be sure to wear some flowers in your hair ...'