“Digitale Informationen werden niemals rein zufällig überleben”

Feature | 2. August 2004 von admin 0

Neil Beagrie

Neil Beagrie

Herr Beagrie, in unseren modernen Gesellschaften geht jeder davon aus, dass Informationen digital verfügbar sind. Warum kann dieser Umstand für uns zu einer Bedrohung werden?

Beagrie: Wenn die Umstände günstig sind bleibt Papyrus oder Papier über Jahrhunderte hinweg erhalten, ohne dass jemand etwas dazu tun muss. Bestes Beispiel hierfür sind die Schriftrollen vom Toten Meer, die mehrere tausend Jahre alt sind. Es dauert hunderte von Jahren bis sich Sprachen oder Handschriften in einem Umfang weiter entwickelt haben, dass sie nur noch von Spezialisten gelesen werden können.

Im Gegensatz dazu überleben digitale Informationen und der Zugang zu ihnen nicht durch Zufall. Es bedarf hierfür vielmehr einer ständigen und aktiven Pflege. Es ist durchaus möglich, dass in einigen Jahren niemand mehr unsere digitalen Informationen lesen kann. Die Speichermedien der vergangenen Jahrzehnte – Lochstreifen, Disketten, CD-ROM, DVD – entwickeln sich rasant weiter, jedes aktuelle Stadium wird bald wieder vom Markt verschwunden sein. Daher haben digitale Speichermedien verglichen mit anderen Medien eine relativ kurze Archivierungslebensdauer. Da Menge, Heterogenität und Komplexität der digitalen Informationen stetig zunimmt, wird die Notwendigkeit für ein aktives Management der Daten immer dringlicher und entscheidender für eine immer größer werdende Anzahl an Organisationen.

Wie dringend ist diese Bedrohung?

Beagrie: Die Bedrohung ist sehr realistisch und sehr heimtückisch. Die Zukunft unseres kulturellen Erbes, und unserer Wissens- und Informationsgesellschaft hängt davon ab. Es ist schwierig, Buch darüber zu führen, wie viel Wissen uns wohl schon verloren gegangen ist. Einzelne Beispiele sind bekannt, wie etwa der verzweifelte Versuch der BBC, das über 900 Jahre alte Domesday Book, das Reichsgrundbuch Englands, in elektronischer Form aufzubewahren. Das liegt natürlich zum einen daran, dass niemand so fürchterlich gerne über Misserfolge oder Verluste redet. Außerdem lassen sich in manchen Fällen verlorene digitale Informationen durch Papierkopien mühselig wieder gewinnen. In diesen Fällen ist der Verlust subtiler: Der Wert der Informationen ist gewissermaßen herabgesetzt weil die zugehörige Verlinkung oder angehängte Dokumentation plötzlich weggefallen ist. Wir verfügen in einigen Gebieten über aktuelle Statistiken. So beträgt beispielsweise die durchschnittliche Lebensdauer einer Webseite rund 44 Tage. Von dieser Aussage sind nicht nur bewusst “kurzlebige” Informationen von lokalem Interesse betroffen, sondern auch bedeutende Datenressourcen. Als Beispiel mögen hier URLs dienen, die in medizinischen Artikeln als Referenz oder Link angegeben waren, nach einiger Zeit aber ins Leere führten.

In Zukunft wird es viele statistische Daten über die Zunahme der digitalen Informationen geben und auch klare Prognosen für die ansteigende Datenflut auf Gebieten wie der wissenschaftlichen Forschung. Die Menschen werden mit Hilfe der Technologie in ein paar Jahren mehr Daten generieren als jemals zuvor in ihrer Geschichte. Nicht alle diese Informationen sind von konstantem und beständigem Wert, ein Großteil davon wahrscheinlich aber schon. Damit wird die Kluft zwischen der Fähigkeit, Daten zu erzeugen und der Fähigkeit sie zu erhalten und zu verwalten immer breiter. Manch Einer sieht uns ob dieser Kluft schon ins informationsarme “digitale Mittelalter” abrutschen.

Inwiefern ist unser kulturelles Erbe davon betroffen? Gilt dies alles auch für Unternehmen?

Beagrie: Die Art und Weise wie wir digitale Informationen aufbewahren betrifft Literatur, Kunst und Archive – insofern die Daten eben digital vorliegen. Davon betroffen ist auch die Forschung, etwa die Daten über den globalen Klimawandel. Sowohl Einzelpersonen als auch Unternehmen sind in zunehmendem Maße beeinträchtigt. Etwa durch neue Geschäftsmodelle, die darauf basieren, dass der Zugang zu digitalen Informationen gemietet wird anstatt physische Kopien zu erwerben. Das hat zur Folge, dass sich die Verlagshäuser verstärkt nach vertrauenswürdigen Dritten umschauen, wie etwa die nationalen Bibliotheken, damit sie die Archivierung gewährleisten und den Kunden den Erhalt der gemieteten digitalen Informationen auf lange Sicht sichern können. Immer mehr entsprechende Vorschriften zwingen Unternehmen aller Branchen, den Zugang zu digitalen Informationen oft zehn Jahre oder länger zu gewährleisten. Ich persönlich finde es interessant, dass Konzepte wie das Information Lifecycle Management, langsam auch von den Anbietern von Software aufgegriffen werden.

Was wird von technologischer Seite unternommen, um die digitalen Informationen verfügbar zu halten?

Beagrie: Grundlegende Bausteine wie Massenspeicher, Backup und Kopiersysteme sind weitgehend verfügbar. Migration und Emulation von Daten sind etablierte Techniken um diese gegen Veralterung zu schützen. Meiner Meinung nach bietet derzeit jedoch kein Anbieter eine Lösung an, die langfristige Themen, wie Skalierbarkeit oder Interoperabilität, abdeckt. Außerdem sind technische Lösungen nur ein Teil der gesuchten Antwort. Organisatorische Themen wie Datenstrategie und Implementierung sowie die Kollaboration innerhalb und zwischen den Unternehmen sind ebenso entscheidend für eine effektive Lösung.

Wie verhindern Bibliotheken den Diebstahl von Daten?

Beagrie: Bei sehr sensiblen oder kommerziellen Materialien implementieren Bibliotheken und Archive wie die British Library eine Reihe physischer und systemtechnischer Maßnahmen, und Maßnahmen um die Sicherheit und den Zugang zu den Daten zu regeln und zu überwachen. Bei weniger sensible Informationen oder solchen, bei denen die Autoren – etwa Wissenschaftler – aus eigenem Interesse einen einfachen Zugang erlauben, ist dieser mit Hilfe von Lizenzen geregelt.

Wenn Informationen und Wissen nur noch digital verfügbar sind, wie einfach ist es dann, die Geschichte des 20. Jahrhunderts komplett zu löschen?

Beagrie: Leider wird das viel zu einfach sein, solange es keine Infrastruktur für zuverlässige digitale Speicher und ein gewisses Maß an Reproduktion zwischen diesen gibt. Das Vertrauen in Quellen und Dienste ist ohnehin bereits ein wichtiges Thema im Internet. Bibliotheken, Archive, Museen sowie Wissenschaft und Forschung sollten beim Schutz der Authentizität der Daten und deren Erhalt im digitalen Zeitalter genauso eine zentrale Rolle spielen wie in den vergangenen Jahrhunderten. Die Reproduktion ist ebenfalls ein grundlegendes Thema: Bei Informationen, die sich nur auf eine Organisation oder auf ein bestimmtes Land beziehen, ist das Risiko viel größer, dass sie nach einigen Jahrzehnten oder Jahrhunderten manipuliert werden.

Wie wird mit diesem Thema im internationalen Vergleich umgegangen?

Beagrie: Es herrscht ein hohes Maß an Übereinstimmung bei den Hauptthemen und bei den gewünschten Ansätzen zwischen den führenden Ländern in Europe und den USA. Den größten Unterschied gibt es wahrscheinlich in der Art und Weise, wie die Forschung auf dem Gebiet der Datenspeicherung und die notwendige technische Infrastruktur finanziert wird. Die USA beispielsweise haben kürzlich ein Projekt mit einem Volumen von 100 Millionen Dollar gestartet, das “National Digital Information Infrastructure and Digital Preservation Program” (NDIIPP). In Europa gibt es derzeit nichts Vergleichbares. Auf der anderen Seite sind europäische Länder traditionell besser bei der Koordination und bei kollaborativen Programmen.

Gibt es eine Art internationale Zusammenarbeit in Bezug auf die Erhaltung digitaler Informationen?

Beagrie: Die nationale und internationale Zusammenarbeit nimmt zu. In Großbritannien haben sich 27 große Organisationen zur Digital Preservation Coalition zusammengeschlossen, darunter nationale Bibliotheken und Archive, Verlagshäuser, Rechenzentren, universitäre Forschungsbibliotheken und Finanzierungsgremien. Diese Koalition ist nicht nur in Großbritannien aktiv, sondern beteiligt sich auch an Programmen von Institutionen in Australien, den USA und in zunehmendem Maße auch in Europa. In europäischen Ländern wie Dänemark und Deutschland werden vergleichbare Organisationen gegründet, um fachübergreifende Zusammenarbeit zu koordinieren.

Es ist auch eine zunehmende internationale Zusammenarbeit zwischen den nationalen Büchereien und Archiven zu beobachten. Die British Library ist beispielsweise Mitglied des internationalen Konsortiums der nationalen Bibliotheken. Das Konsortium sammelt und archiviert Daten aus dem Web. Das erfordert ein sehr hohes Maß an Automatisierung und komplexe Werkzeuge. Diese Werkzeuge sind den Suchmaschinen abgeschaut, die schließlich auch das Internet nach Informationen durchkämmen und diese in gewisser Weise katalogisieren.

Wie lässt sich vermeiden, dass wir in ein paar Jahrzehnten wieder vor dem gleichen Problem stehen?

Beagrie: Ich möchte hier fünf Punkte hervorheben:

  • Das Wesentliche muss geklärt sein: Maßnahmen für die Systemsicherheit, Backup und Wiedergewinnung der Daten im Katastrophenfall und eine Dokumentation, die es erlaubt zu prüfen, ob alle Daten wieder hergestellt sind
  • Es gilt, offene Standards und archiv-freundliche Rechte zum Schutz des geistigen Eigentums zu implementieren. Nur so lassen sich langfristig Interoperabilität, Migration und Archivierung von Daten zwischen den Systemen gewährleisten.
  • Unternehmen sollten über ein Information Lifecycle Management verfügen, damit klar ist, wie die Daten erzeugt, verwaltet und verwendet werden sollen. Die Prozesse müssen automatisiert, der Support gewährleistet sein. Der Return-on-Investment in Bezug auf Dokumente wird durch ein optimiertes Speicher- und Informationsmanagement erzielt
  • Wichtig sind zuverlässige Repositorien und eine langfristige nationale Infrastruktur für digitale Informationen. Ohne diese Vorkehrungen können die großen Investitionen und die potenziellen Vorteile der Digitalisierung unserer Wissensdatenbank untergraben werden.
  • Die Anbieter für Informations- und Kommunikationstechnologien müssen in Hinblick auf die Erhaltung digitaler Daten auf lange Sicht zusammen arbeiten. Das wird nötig sein, um Systeme und Werkzeuge herzustellen, die skalierbar und nachhaltig sind und die Anforderungen Einzelner sowie Unternehmen erfüllen, deren Datenbanken in den kommenden Jahren immer umfangreicher, vielfältiger und digital sein werden.

Weitere Informationen

The British Library
Digital Curation Centre
Digital Preservation Coalition
Joint Information Systems Committee
US NDIIPP program

Leave a Reply