maandag 20 september 2010

iPRES2010 (1): de wetenschap worstelt met een overvloed aan data

ipres 041 De jaarlijkse iPRES is in Wenen van start gegaan met, helaas, een wat teleurstellende keynote van Tony Hey van Microsoft. Hij sprak over het ‘Fourth Paradigm’ in de wetenschap – wetenschap wordt nu bedreven op basis van grote hoeveelheden data (de ‘data deluge’), en dat brengt nieuwe regels, problemen en oplossingen met zich mee. Alsof we dat niet al wisten. Sommige van Hey’s dia’s stamden uit 2004, gaf hij zelf toe. Wat hij verder zei over grote hoeveelheden diverse data en de noodzaak om die aan elkaar te koppelen, had ook uit dat jaar kunnen stammen. ipres 026 Wat ik nog het aardigst vond was om te zien dat Microsoft nu participeert in allerhande projecten die technische oplossingen zoeken: Planets, SCAPE, DataCite, enz., ‘because we are closest to the problem’. Want een van de deeloplossingen van digitale duurzaamheid moet toch zijn dat we bij creatie van de gegevens automatismen inbouwen die later van nut blijken te zijn.

David Giaretta, o.a. Executive Director van de Alliance of Permanent Access, presenteerde de case studie van de European Space Agency (ESA) met de opmerking: ‘They have actually decided to put some money into it for the long term’. En dat is mooi, want tot voor kort werd alles na 10 jaar weggegooid. En daar zitten belangrijke data tussen, over temperatuurveranderingen op aarde enzo. ipres 002 Dat soort gegevens wordt door satellieten verzameld. Hoe een Europese infrastructuur voor dit soort data (met vele belanghebbenden en vele visies en vele workflows) gaat werken, liet David zien in een aantal slides dat in hoog tempo voorbij vloog. Te hoog voor mij … Dat moeten we nalezen in de proceedings, die binnenkort online komen.

Sssst, de middagsessie gaat beginnen. Preserving Web Archives: one size fits all? Georganiseerd door de IIPC. Ik denk dat ik het antwoord op de hamvraag wel kan raden, maar verheug me op het hoe.

Geen opmerkingen: