Im September 1999 wurde Google als offizielle Suchmaschine im Web gestartet.
Sie war schon lange vorher ein Geheimtip. In der einjährigen Beta-Phase vor
dem offiziellen Start wurde Google schon sehr intensiv genutzt. Nach Informationen
von Google gab es über 3,5 Mill. Zugriffe pro Tag zum Ende der Beta-Phase.
Ende 2001 wurden auf allen zugehörigen Servern weltweit 150 Mill. Zugriffe
registriert.
Der Name Google wurde von Milton Sirotta, dem Neffen des amerikanischen Mathematiker
Edward Kasner geprägt. Er wurde abgeleitet von dem Wort "googol"
das für eine Zahl steht die eine Eins gefolgt von 100 Nullen bedeutet.
Der Firmensitz von Google befindet sich in Mountain View, Californien.
Die Suchtechnologie wurde an der Standford University in einem Zeitraum von 3
Jahren entwickelt. Bei einfacher Bedienung sollten auch unerfahrene Nutzer schnell
die gewünschten relevanten Informationen erhalten.
Technische Infos:
Google verwendet über 54 000 Computer mit rund 100 000 Prozessoren in 6 Datencenter
(April 2003)
Betriebssystem: Linux
Über Language,
Display and FilteringOptions können persönliche Einstellungen vorgenommen
werden. Damit das Ergebnis dauerhaft gespeichert werden kann, müssen Cookies
akzeptiert werden (Standardeinstellung des Internet Explorer).
- Interface Language: Sprachauswahl der Bedienungs- und Hilfeseiten, German
- deutsch
- Search Language: Suche nur in Dokumenten mit der ausgewählten Sprache
- Number of Results: Anzahl der Ergebnisse die auf einer Seite angezeigt
werden. Je höher diese Zahl (max.100) je weniger muss "geblättert"
werden, dafür wird man mehr scrollen.
- Safe Search Filtering: Durch Anklicken von
"Use SafeSearch to filter my search results" werden anstössige
sexuelle Inhalte, soweit möglich, ausgeschlossen.
Anzahl erfasster durchsuchbarer Webseiten:
über 1,6 Milliarden (Stand Dezember 2001)
Eintrag der Index-Software(ins Logfile):
Googlebot/1.0
Einfache Suche
Standardeinstellung ist die UND-Suche.
Eingabe mehrerer Worte durch Leerzeichen getrennt: Alle diese Worte müssen
im Ergebnis enthalten sein.
Der Button "Auf gut Glück" zeigt immer die bestplazierte Webseite
einer Suche. Damit soll dokumentiert werden wie treffsicher Google Ergebnisse
findet.
+
wird benutzt um Stoppwörter
verwenden zu können.
-
schliesst das zu suchende Wort
ausdrücklich aus. das Zeichen setzen Sie vor jedes Wort, das von der Suche
ausgeschlossen werden soll.
" "
Phrasensuche,
es werden Wortgruppen gefunden.
Genau diese Wortfolge wird gesucht.
Das Suchergebnis lässt sich gut einschränken. Auch Bindestriche (-),
Punkte (.) oder Schrägstriche (/) Gleichheitszeichen (=) und Apostroph (')zwischen
den Worten (ohne Leerzeichen) bilden eine Phrase.
Stoppwörter in einer Phrase werden berücksichtigt.
Gross-/Kleinschreibung:
Gross oder Kleinschreibung
spielt keine Rolle
Im Gegensatz zu
vielen anderen Suchmaschinen gibt es offiziell bei Google keine ODER-Suche,
die bedeutet dass nur eines der eingegeben Worte gefunden werden muss. Bei Google
müssen immer alle Begriffe gefunden werden.
Inoffiziell ist der Operator OR zur ODER-Suche verwendbar.
Trunkierung mit Fragezeichen (?) oder Sternchen (*) ist nicht zugelassen. Damit
sollen ungenaue Ergebnisse ausgeschlossen werden.
Stoppwörter
Häufige Worte ohne direkte Aussage werden ignoriert. Dazu gehören auch
einzelne Zahlen oder Buchstaben und Domainkürzel wie com oder de.
Mit einem Pluszeichen (+) davor werden Stoppworte angezeigt.
Werden Stoppworte in eine Phrase (Anführungszeichen "") eingeschlossen,
werden sie berücksichtigt.
Weitere Suchoptionen:
link:
link:at-web.de
listet alle Seiten die auf die mit einem absoluten Hyperlink auf die at-web Startseite
verweisen, auch Seiten innerhalb der at-web Domain werden gezählt.
site:
(+stoppwort)
site:at-web.de
+at
Listet alle Seiten der at-web Domain die den Begriff at enthalten.
Es muss immer zusätzlich ein Wort eigegeben werden
related:
related:www.at-web.de/index.htm
listet ähnliche Seiten auf
cache:
cache:www.at-web.de/start.htm
listet die Seite aus dem Cache
allintitle:
Beschränkt die Suche auf den Titel einer Webseite, findet alle Worte
(UND-Suche)
allinurl:
Es wird nur in der URL nach dem Begriff gesucht
allinbody:
Suche nur im sichtbaren Text einer Webseite
intitle:
wie allintitle: jedoch müssen nicht alle Worte im Titel stehen
inurl:
wie allinurl: jedoch müssen nicht alle Worte in der
URL stehen
inurl:pdf
Suche nach PDF-Dateien, Beispiel diplomarbeit inurl:pdf
listet tausende Diplomarbeiten als PDF-Datei
filetype:
Funktion wie ext:
ext:
Beschränkt die Suche auf Dateitypen (pdf, php, asp, txt, doc, xls, pps,
ps).
ext:txt listet nur Textdateien.
Lässt sich sinnvoll mit anderen Optionen verwenden
etwa:
playlist ext:txt
Weitere Dateitypen:
Lotus 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku), Lotus WordPro (lwp)
MacWrite (mw), Text (ans, txt), Microsoft Write (wri)
Erweiterte Suche
(Advanced Search):
Seit Ende Juli 2000 gibt es bei Google eine Seite zur erweiterten Suche.
Zu diesem Zeitpunkt ist die erweiterte Suche nur über die englische Version
der Google-Startseite erreichbar.
In einem Formular können folgende Optionen zur Suche benutzt werden: Find results
- with all of the words:
Suchwort(e) eingeben die mit UND verknüpft werden, alle Worte dieser Eingabemaske
müssen gefunden werden
- with any of the words: ODER-Suche
Mindestens eines Worte muss gefunden werden
- with the exact phrase:
Phrasensuche, genau dieser Wortlaut muss gefunden werden , Gross-/Kleinschreibung
wird beachtet. - without the words:
NICHT-Suche, Wörter dürfen im Ergebnis nicht enthalten sein.
Domains Only (Don't) return results from the site or domain:
Nur in einer bestimmten Domain suchen, oder Domains von der Suche auschliessen.
Angabe der Domain ohne www, beispielsweise at-web.de, entspricht dem site:
Befehl der einfachen Suche. Gut zum Ermitteln der Anzahl erfasster Webseiten einer
Domain, vorausgesetzt Sie verwenden ein universelles Wort, das sich auf allen
Seiten wiederfindet (eigener Name, Firmenname,..)
Occurences
Hier kann eine sogenannte Feldsuche gestartet werden, es wird nur in bestimten
Bereichen gesucht. - anywhere in the page: keine Einschränkung - in the title of the page: Nur im Seitentitel suchen - in the body of the page: Nut im sichtbaren Text der Webseite suchen - in the url of the page: Das Suchwort muss in der Webadresse enthalten
sein. Entweder im Domainnamen, Verzeichnisnamen oder Dateinamen
-Return pages written in : Hier eine Sprache auswählen
- 10 (20, 30, 50, 100) Results: Anzahl der Seiten auf der Ergebnisliste
Seitenspezifische Suche (Page-Specific Search):
- Find pages that link to the page: entspricht dem link: Befehl
der einfachen Suche.
- Find pages that are similar to the page:
Es sollen thematisch ähnliche Seiten angezeigt werden. Nach meinen Erfahrungen
funtioniert das nur teilweise, mitunter werden Seiten angezeigt die keinen thematischen
Bezug darstellen..
Themenspezifische Suche (Topic-Specific Search):
Themenbezogene Suchemöglichkeiten für die Betriebssysteme:
BSD und Linux sowie über den Apple MacIntosh.
Ausserdem:
- Universitätssuche
- US Regierungsdomain Suche
Google ist WAP-fähig. Ein Anruf von einem WAP-fähigen Endgerät
signalisiert Google, die Ergebnisse im WML-Format zu präsentieren.
Der Google WAP-Emulator ist über folgenden Link zu erreichen: Search the Web on
your Wireless Phone or PDA
Superschnelle Suche
Wenn Ihnen die Anzeige der Überschriften genügt, bekommen Sie von
Google unglaublich schnell Ihre Ergebnisse. Google Schnellsuche
Google Guide
Eine umfassende englischsprachige Anleitung zur Google Suche betreiben Nancy Blachman und Jerry Peek: Google Guide
Ergebnisanzeige
Seit Mitte Oktober 2000 erscheinen suchwort-abhängige Einblendungen im
oberen Teil der Ergebnisliste. Die Textlinks sind farbig markiert und als sponsored
Links gekennzeichnet.
Ausführliche Informationen: Google - Advertising
Wichtigster Teil der Ergebnisanzeige ist die Titelzeile einer HTML-Seite.
Farblich markiert und mit einem Link zur Webseite hinterlegt entscheidet der enthaltene
Text oftmals, ob eine Webseite angesteuert wird.
Wird statt des Seitentitel eine URL angezeigt, ist die Seite enweder noch nicht
im Index oder hat keinen Seitentitel.
Der nachfolgende Beschreibungstext wird aus der Webseite generiert und
enthält den markierten gesuchten Begriff sowie einige Worte vorher und danach.
Es können auch zwei Beschreibungszeilen erscheinen. Der generierte Text muss
nicht vom Beginn der Webseite stammen.
In grüner Schrift wird die nicht anklickbare URL der Webseite dargestellt.
Cache: Webseiten werden im Google-Cache gehalten. Selbst wenn eine Webseite
nicht erreichbar ist, kann deren Inhalt aus dem Speicher abgerufen werden. Besonders
für Nachrichtenseiten soll dieses Verfahren Vorteile bringen um auch noch
frühere Meldungen zu finden.
ähnliche Seiten ( GoogleScout):
Wenn beispielsweise die Seite eines Museums nach ähnlichen Seiten abgefragt
wird, sollten Seiten anderer, thematisch verwandter Museen aufgeführt werden.
Diese Funktion muss man einfach ausprobieren. Nicht zu jeder Webseite werden ähnliche
Seiten gefunden. Es wurden bei meinen Suchen oftmals Seiten dargestellt die thematisch
keinen Bezug zur Webseite haben.
Dateigrösse: 2k bedeutet dass der Textanteil dieser Seite 2 Kilobyte gross ist. Fehlt
diese Angabe ist die Seite noch nicht indiziert.
Eingerücktes Ergebnis:
Bedeutet, dass es mehrere relevante Seiten von dieser Web-Site gibt. Das relevanteste
Ergebnis wird zuerst angezeigt.
Sehr interessant:
Im oberen Teil der Ergebnisseite befindet sich ein Link: Diese Seite per E-Mail
versenden. Damit ist es relativ einfach den Platz in der Ergebnisliste zu
dokumentieren und über einen längeren Zeitraum zu verfolgen.
Suchmaschinenanmeldung
Unter dem folgenden Link Addurl
finden Sie die Anmeldeseite von Google mit einer Erläuterung.
Es gibt keine speziellen Erfassungskriterien.
Unter anderem wird erklärt, dass es genügt, nur die Startseite einer
Website anzumelden. Besonders wenn Sie öfters neue Seiten oder neue Inhalte
präsentieren ist es besser, die neuen Seiten sofort nach Erstellung einzeln
anmelden.
Google akzeptiert auf jeden Fall Dateien mit folgenden Endungen: pdf, asp, jsp, hdml, shtml, xml, cfml