vrijdag 3 april 2009

DigCCurr (1): technische infrastructuur delen

Ik ben vanuit Washington DC een uurtje vliegen naar het zuiden afgezakt naar de DigCCurr ('say dij-seeker' of Nederlands fonetisch iets als Didzj-sie-kurr) 2009 conferentie in Chapel Hill, NC. Meer dan 270 deelnemers, dat is nogal wat.

Vanochtend was er een interessante lezing over 'girodssessieedistribueerde netwerken'. Het was best wel technisch, en dat is niet mijn sterkste kant, maar bij al ons denken over beleid moeten we vooral niet vergeten nieuwe technische mogelijkheden mee te nemen.

De North Carolina School of Information and Library Sciences (SILS; organisator van de conferentie) heeft een interessant probleem opgepakt: hoe kun je je techniek zo organiseren dat vele en veelsoortige organisaties gezamenlijk gebruik kunnen maken van een "grid" - de som van een heleboel opslagfaciliteiten. Daarbij wil je ook faciliteren dat gegevens van de omgeving van de maker soepel wordt overgezet naar de omgeving van een digitaal archief. Bovendien wil je mogelijk maken dat iedere eigenaar van informatie zelf de baas blijft over zijn of haar informatie, waar die zich fysiek ook bevindt ergens op het "grid".

irods Een (gedeeltelijk?) antwoord is iRODS: Integrated Rule-Oriented Data System. Dit systeem probeert niet om allerhande organisaties dezelfde preserveringsstandaarden op te leggen (vele tekenen wijzen erop dat dat toch niet werkt) maar om het beleid en de regels van specifieke organisaties te vertalen naar automatisch door systemen uit te voeren taken. Dat woord 'automatisch' is belangrijk, want menselijk ingrijpen wordt steeds lastiger (en veel te duur) naarmate de hoeveelheden data groter worden. Iedere organisatie of groep organisaties die meedoet aan het systeem definieert zijn 'community profile' - de hele set van regels, toegangsregimes, authenticatie-voorwaarden en ga zo maar door. Dat community profile wordt technisch vertaald en in een 'rule engine' gestopt en gekoppeld aan de gegevens van de inbrengende organisatie. Een gebruiker die informatie opvraagt krijgt van de 'rule engine' te horen wat hij wel en niet mag, en ook preserveringsacties worden door de 'rule engine' in gang gezet.

Natuurlijk zijn er technisch gezien de nodige haken en ogen, maar het idee is aanlokkelijk - met name voor organisaties die zelf niet de middelen hebben om een eigen depot op te zetten of te onderhouden. Met behulp van deze tool kunnen zij gezamenlijk wel een systeem in leven houden dat hun data veilig opslaat - waarbij zij zelf alle controle houden over die data.

irodspanel Maar werkt het ook? Caryn Wojcik van de Records Management Division van de Staat Michigan (midden op de foto) vertelde dat zij vooral oplossingen zoekt die WERKEN, die praktisch zijn. Zij beschreef het DCAPE project (Distributed Custodial Archival Preservation Environments) dat iRODS inmiddels toepast. Het doel van DCAPE is een generieke data infrastructuur te bouwen waarin allerhande sectoren (cultuurhistorie, overheid, bibliotheken, wetenschap) digitale gegevens kunnen opslaan.

DCAPE is "nog" maar een project, en het is nog niet bewezen dat het werkt, maar ik heb Caryn's e-mail adres, en ik ga dit project goed in de gaten houden. Want wat werkt voor Amerikanen die van nature wars zijn van centrale regie, zou ook wel eens kunnen werken in een land van polderdemocratie.

Foto's (IA): De sessie over gedistribueerde netwerken zat zo vol dat we moesten uitwijken naar een grotere zaal; in het midden het principe van iRODS; onderaan het panel van de iRODS sessie: in het midden Caryn, rechts Richard Marciano van iRODS.

Geen opmerkingen: