|
Eine Einführung: robots.txtUnd weil es so ist, daß manche Seiten eines Angebots nicht durch Suchmaschinen erfaßt werden sollen, haben kluge Menschen einen "robot exclusion standard" ersonnen. Auf die gute Nachricht folgt sofort die schlechte: Dieser Standard ist gar keiner, sondern eine Empfehlung. Will sagen, die Roboter sollen sich daran halten, müssen es aber nicht! Wie sieht das Ganze nun praktisch aus?Im Hauptverzeichnis (und nur dort!) ist eine Datei mit dem Namen robots.txt abgespeichert. Mit jedem Browser kann man sich diese Datei ansehen. Schauen Sie sich zum Beispiel meine an: http://www.klug-suchen.de/robots.txt
Wenn Sie Ihre Seiten bei einem Provider abgelegt haben, dann können
Sie sich diese Datei auch ansehen; Sie sollten es sogar! (Nochmals: Im
Hauptverzeichnis; nicht in Ihrem Verzeichnis!) Wenn es keine robots.txt gibt...ist das nicht tragisch. Dann ist es den Robotern erlaubt, alle erreichbaren Seiten zu laden. Was bedeuten die Eintragungen?Zeilen die mit dem Doppelkreuz (#) anfangen sind Kommentare. Meist wird in der ersten Zeile im Kommentar die mail-Adresse des Verantwortlichen (im Jargon: webmaster) mitgeteilt. Kommentare werden nicht verarbeitet.
In der nächsten Zeile steht so etwas wie
Ich denke, das genügt. Wenn Sie noch mehr wissen wollen, finden Sie (englischsprachige) Informationen u.a. hier. Alle Teile dieses Angebots unterliegen dem Copyright und sind nach
Urheberrechtsgesetz
als Datensammelwerk geschützt.
Jede Art der Verwertung bedarf der
schriftlichen Zustimmung des Rechte-Inhabers. Copyright 1997-2003 Katja Ebert Medien und Kommunikation |