Deutschland und Österreich archivieren das nationale Web

Vorreiter für die Archivierung von Webseiten ist das Internet Archive. Seit 1996 werden Webseiten erfasst und bei Veränderungen wiederholt archiviert. Im Vergleich dazu sind Österreich und Deutschland ziemlich spät dran, wertvolle Inhalte aus dem Internet für die Nachwelt zu erhalten.

In den Internet Archiven sind mehr als 85 Milliarden Seiten gespeichert. Je nach Bedeutung und Intensität einer Website werden sogar mehrere Schnappschüsse pro Monat angefertigt. Im Jahr 2007 fertigten die Internet Archive eine Bestandsaufnahme von 2 Milliarden Webseiten aus mehr als 60 Ländern an.

Von diesen Dimensionen sind die deutschsprachigen Nachkommen weit entfernt. Die Zielsetzung ist jedoch prinzipiell gleich.

Das Web ist unsere Kultur unsere soziale Fabrik. Was heute vorhanden ist, kann morgen bereits verschwunden sein.

Die durchschnittliche Lebenszeit einer Webseite wird von Internet Archive mit 44-75 Tage angegeben.

In Österreich ist seit dem 1. März ein Gesetz in Kraft, welches die Erfassung von Informationen aus dem österreichischen Internet regelt. Sämtliche Domains mit der Endung .at sowie andere Top-Level Domains, die geografisch in Österreich angesiedelt sind oder inhaltlichen Bezug zu Österreich aufweisen, sollen erfasst werden. Vorrangig werden Kopien von Webseiten durch Crawl-Vorgänge (Harvesting) eingesammelt. Ein bis viermal im Jahr werden Crawl-Durchgänge laufen. Mit ausgesuchten Anbietern können kürzere Intervalle vereinbart werden.

In Deutschland ist die “Verordnung über die Pflichtabgabe von Medienwerken an die Deutsche Nationalbibliothek” vom 17.Oktober 2008 in Kraft. Einige Webmaster haben sich bereits die bange Frage gestellt, wie die Pflichtabgabe behandelt wird und wer davon betroffen ist. Es gibt derzeit einige Publikationen die abgeliefert werden. Hierzu wurden entsprechende Vereinbarungen mit den Herausgebern der Publikationen getroffen.

Für Webseiten in Deutschland finden wir in den Regeln für die Ablieferung von Netzpublikationen, eine eindeutige Aussage:

Webseiten aller Art können derzeit noch nicht gesammelt und langzeitarchiviert werden. Die Deutsche Nationalbibliothek bittet deshalb, von einer Lieferung abzusehen, bis durch andere Verfahren, wie z. B. Harvesting, die Sammlung solcher Publikationen ermöglicht wird.

Ebenso wie Bibliotheken eine Auswahl der gedruckten Werke treffen, wird dies für Inhalte geschehen, die im Internet veröffentlicht werden.

Die Auswahl der zu archivierenden Inhalte wird mit dieser Passage – aus der Novelle zum dem österreichischen Mediengesetz – zum Ausschluss von Inhalten gut dargestellt:

…an deren bibliothekarischer Bewahrung kein wissenschaftliches, kulturelles oder sonstiges öffentliches Interesse besteht

Das Gesetz über die Deutschen Nationalbibliothek argumentiert ähnlich:

Die wichtigsten Einschränkungen betreffen insbesondere alle Netzpublikationen, die nicht in öffentlichen Netzen verbreitet werden, die nur von privatem Interesse sind oder die lediglich gewerblichen, geschäftlichen oder innerbetrieblichen Zwecken dienen.

Die Archivierung wird sich also auf Inhalte beschränken, denen ein bibliothekarischer Wert zugesprochen wird.

Weitere Beiträge zur Archivierung von Webseiten:
Webarchiv – Suchmaschine für die Vergangenheit
Internet-Archiv will NASA-Bilder sammeln
55 Milliarden Webseiten im Internet Archiv

Webseiten:
Österreichische Nationalbibliothek – Webarchivierung
Deutsche Nationalbibliothek – Netzpublikationen
Internet Archive

Comments

2 responses to “Deutschland und Österreich archivieren das nationale Web”

  1. Elke Avatar
    Elke

    Hallo,

    vielleicht eine nützliche Zusatzinformation: Die französische Nationalbibliothek archiviert bereits seit einigen Jahren das “französische Internet” und publizierte nun die erste Erfahrungen, die durchaus zwiespältig sind. Mehr Informationen finden sich hier: Dépôt légal de l’Internet: http://www.bnf.fr/pages/zNavigat/frame/infopro.htm

  2. Webdesign Saarland Avatar

    In Zeiten der Vorratsdatenspeicherung, des schwindenden Datenschutzes und des Ingnorierens der Privatsphäre ist dies nicht sonderlich wunderlich.

    Das Problem ist immer die Tatsache, dass niemand wirklich weiß was genau über wen und wo gespeichert wird