Erstellung von Internetseiten Hilfen zu Windows Bildbearbeitung Hilfen zu Office Datenschutz Downloads
HTML: Suchmaschinen-Ausschluss     Seite drucken

So erreichen Sie, dass untergeordnete Seiten Ihrer Homepage von Suchmaschinen nicht indiziert werden.

Sie haben Ihre Homepage bei Suchmaschinen angemeldet. Doch Sie möchten erreichen, dass einige untergeordnete Seiten von Suchmaschinen nicht gefunden werden. Das erreichen Sie, indem Sie im Head-Bereich der Seite folgendes Meta-Tag notieren:

<meta name="robots" content="noindex">


Und hier noch weitere Meta-Tag zu diesem Thema:

Meta-Tag Auswirkung
content="all"> Der Robot darf die Webseite nach Belieben indexieren und den Links folgen.
content="follow"> Der Robot soll den Links dieser Webseite folgen.
content="index"> Die Webseite wird indexiert.
content="noimageindex"> Bilder auf dieser Webseite werden nicht indexiert (bei Altavista)
content="noimageclick"> Die Suchmaschine erzeugt keine Links direkt auf die Bilder der Webseite, sondern auf die Webseite
content="noindex"> Diese Webseite soll nicht indexiert werden.
content="nofollow"> Der Robot soll den Links auf dieser Webseite nicht folgen.
content="none"> Der Robot darf die Webseite weder indexieren noch den Links folgen.
content="noarchive"> Die Seite darf nicht mit ins Archiv augenommen werden.

 

Für Google gibt es noch ein paar zusätzliche Infos:

<meta http-equiv="imagetoolbar" content="no" /> im Kopf der Webseite verhindert zum Beispiel das Erscheinen der Google-Image-Toolbar mit der die Bilder direkt gespeichert oder gedruckt werden können.

<meta name="Robots" content="NOARCHIVE" /> wird gerne gegen Google benutzt um das Archivieren von Webseiten zu verhindern. Google speichert ansonsten die Webseite für den Fall, dass der Server mit der Webseite mal nicht erreichbar ist. Gute Idee, aber nichts für Seiten die ständig aktualisiert werden.

 

Das Ganze geht aber auch etwas einfacher mittels der robots.txt Datei, in der die Informationen stehen und auf ganze Verzeichnisse angewendet wird.

Bei der robots.txt handelt es sich um eine reine .txt-Datei (notepad.exe), die im Hauptverzeichnis auf dem Server abgelegt werden muss (bei index.htm)
Beispiel:

# robots.txt zu www.name-der-homepage.de # steht als Kommentar und ignoriert alles Nachfolgende in der Zeiles.
User-agent: irgendeinRobot man kann einen speziellen Robot ansprechen oder mit * alle Robots ansprechen
Disallow: /test/ Alle Datein im Verzeichnis test werden nicht indiziert.
Disallow: /pusemuckel.htm Die Datei pusemuckel.htm wird nicht indiziert.

User-agent: *
Disallow:
/
Ganze Site für alle Robots sperren

User-agent: *
Disallow:
Ganze Site für alle Robots freigeben

User-agent: ia_archiver
Disallow: /
Verhindert die Indexierung durchs Webarchiv

User-agent: Googlebot-Image
Disallow: /
Verhindert die Indexierung der Bilddaten durch Google

Beispiel für diese Site (anklicken)

© Agadoo 2001 - 2007