Google Zeitungsarchiv scannt nicht mehr

Googles Ziel ist es alles Wissen dieser Welt zu organisieren und für alle zugänglich zu machen. Das Wissen in alten Zeitungen gehört ab sofort nicht mehr dazu. Jedenfalls nicht komplett. Das ehrgeizige Projekt die Zeitungsarchive dieser Welt zu scannen wird abrupt unterbrochen. Gestoppt!

Google News und Google Archiv

Die Google News bringen seit 2002 als Nachrichtenüberblick einen thematischen Querschnitt über aktuelle Themen. Tausende Online-Zeitungen und Weblogs finden ihren Weg in die Google News.

In das Google Archiv hingegen schaffen es nach meiner Erfahrung nur die Zeitungen und Zeitschriften. Doch alles was vor 2002 in Zeitungen und Zeitschriften veröffentlicht wurde, ist nicht ohne weiteres für das Google zugänglich. Für ein paar Jahre vor 2002 gibt es noch die Mögichkeit, die elektronischen Archive der Zeitschriften zu nutzen, falls diese zustimmen. Alles was aber vor der elektronischen Ära liegt, ist nur mit höherem Aufwand digitalisierbar.

Davor schreckte Google nicht zurück, ähnlich wie beim Google-Buchprojekt. Im Jahr 2006 startete Google mit wenigen ausgewählten US-Zeitungen wie New York Times und Washington Post die Erstellung des Google News Archives. Im Jahr 2008 wurde das ehrgeizige Projekt deutlich ausgeweitet. Rund 2 000 Zeitschriften gaben ihre Archive frei. Die Zeitreise im Google-Archiv geht bis zu rund 250 Jahre zurück.

Digitalisierung von Zeitschriften für das Google News Archiv

Meistens haben Verlage schon Vorarbeit geleistet. Um historisches Material für die Zukunft aufzubewahren wurden häufig Aufnahmen auf Microchips angefertigt. Mitunter stehen auch PDF-Dateien oder Bilddateien zur Verfügung. Vorrangig arbeitet Google also nicht mit Papiervorlagen. Der Mehrwert besteht darin, dass die Materialien durchsuchbar werden. Mittels Texterkennung werden die Materialien gescannt und verwertbare Texte so umgewandelt, dass sie für die normale Suchtechnologie erfassbar werden. Als fertiges Produkt stellt Google dann durchsuchbare Bilddateien bereit. Es wurden aber auch Exemplare eingscannt, die in reiner Papierform vorlagen.

Mehrere US-amerikanische Zeitungen sollen E-Mail von Google erhalten haben, in denen Google erklärte, keine neuen Materialien zum scannen und indexieren zu akzeptieren. Das erklärte die Online-Ausgabe von Boston Phoenix im Blog “The Phlog”: Google abandons master-plan to archive the world’s newspapers.

Google bestätigte die Einstellung der Archivierungs-Initiative gegenüber Search Engine Land:
“Die Google News Archiv-Suche bleibt weiterhin nutzbar. Wir akzeptieren keine neuen Microfime oder digitale Dateien zur Verarbeitung.”

Zeitungen können, jedoch, falls sie selbst digitalisierte Versionen ihrer Zeitschriften online Stellen, per Sitemap darauf aufmerksam machen.

Daran dürfte sich also auch in Zukunft nichts ändern. Online crawlbare Archive werden weiterhin erfasst.

Google bevorzugt rentablere Projekte

Die Änderung fühlt sich so an, als würde Google sich vorrangig auf Projekte spezialisieren, die einen Gewinn versprechen. Laut Boston Phoenix schrieb Google in der Mail, dass man sich auf andere Projekte konzentrieren wolle, Beispielsweise wurde Google One Pass genannt, ein Programm das Online-Publishern zur Abrechnung von Artikeln und anderen Inhalten dienen soll.

Google:

Publisher können flexibel zwischen verschiedenen Zahlungsmodellen wählen und entscheiden, welche Inhalte sie in Rechnung stellen und welche Inhalte für die Kunden kostenlos sind.

Ungeachtet dieser Änderungen, ist auf der Seite für das Google News-Archiv Partnerprogramm momentan zu lesen:

Wenn Sie ein Anbieter von Inhalten sind und über ein Zeitungsarchiv verfügen, das gut in die Google News Archivsuche passen würde, möchten wir gerne mehr darüber erfahren. Wir suchen nach Primärquellen aus aller Welt – je älter, desto besser.

Das Google News-Archiv bleibt weiterhin eine interessante Quelle um geschichtsbezogene Recherchen durchzuführen.

Google News Archiv Suche


Posted

in

,

by

Comments

One response to “Google Zeitungsarchiv scannt nicht mehr”

  1. Nils Avatar

    die Frage die sich mir stellt: wie lange können daten elektronisch gespeichert werden. für eine schnelle Suche mag das Newsarchiv sehr praktisch sein, aber eine langfristige ( mehrere hundert Jahre) Lösung ist das doch nicht.