Inhalt
- Was ist der noindex-Tag?
- Wann NoIndex, Follow?
- Wie wird ein noindex gesetzt?
- Unterschied zwischen Robots.txt und noindex
- Gründe für die Verwendung von noindex
- Best Practice
dotflow®
dotflow ist die B2B Digitalagentur für smartes Online-Marketing und überzeugende Websites.
Was ist der noindex-Tag?
Der Begriff “NoIndex” bezieht sich auf eine Anweisung innerhalb des Robots-Meta-Tags, die das Indexierungsverhalten von Suchmaschinen steuert. Durch das Setzen von “NoIndex” wird den Crawlern mitgeteilt, dass eine bestimmte Seite nicht in den Suchmaschinen-Index aufgenommen oder, falls bereits indexiert, entfernt werden soll.
Das Meta-Tag kann optional mit den Attributen “follow” oder “nofollow” kombiniert werden, um das Verhalten der Suchmaschinen-Crawler hinsichtlich der Verfolgung von Links auf der Seite zu steuern.
Summary
- NoIndex: Verhindert, dass eine URL in den Index aufgenommen wird oder sorgt dafür, dass sie entfernt wird, falls sie bereits indexiert wurde.
- Nofollow: Verhindert, dass Suchmaschinen den Links auf der Seite folgen. Dies bedeutet jedoch nicht, dass die Ziel-URLs nicht von anderen Quellen indexiert werden können.
- Index: Standardmäßig erlaubt dieses Attribut die Indexierung der Seite, wenn nichts anderes angegeben ist.
- Follow: Erlaubt Crawlern, Links auf der Seite zu verfolgen und diese für die Indexierung zu prüfen. Auch dies ist der Standard, wenn nichts explizit angegeben wird.
Wann NoIndex, Follow?
Es gibt Fälle, in denen bestimmte Seiten nicht in den Google-Index aufgenommen werden sollen, aber die auf ihnen befindlichen Links weiterhin verfolgt werden sollen. In diesen Fällen ist die Kombination “NoIndex, Follow” empfehlenswert. Diese Einstellung kann beispielsweise für Tag-Seiten, interne Suchergebnisse oder bestimmte Archive nützlich sein.
Praxistipp
Das Deindexieren einer bereits indexierten URL kann einige Wochen dauern, da Google regelmäßig seine Indexierung aktualisiert. Geduld ist hier gefragt.
Wie wird ein noindex gesetzt?
Der NoIndex-Tag wird direkt im -Bereich des HTML-Codes einer Seite eingefügt. Alternativ kann dieser auch mithilfe eines SEO-Plugins wie RankMath direkt über das CMS eingefügt werden. Das vorgehen dazu ist recht einfach:
1. Seite oder Beitrag bearbeiten
Öffnen Sie die gewünschte Seite oder den Beitrag im WordPress-Editor.
2. RankMath SEO-Optionen aufrufen
Scrolle Sie nach unten zu den RankMath SEO-Einstellungen.
3. Indexierungsstatus ändern
Gehen Sie zum Tab Erweitert und setzen Sie die Option Robots Meta auf „NoIndex“.
4. Speichern & Aktualisieren
Speichern Sie die Änderungen, damit Google die neue Anweisung berücksichtigt.
Der Unterschied zwischen der robots.txt und dem Robots-Meta-Tag
Eine weitere Möglichkeit, die Indexierung von Seiten zu steuern, bietet die Datei robots.txt. Allerdings gibt es hier einen entscheidenden Unterschied:
- Robots.txt: Steuert, welche Seiten oder Verzeichnisse ein Crawler überhaupt besuchen darf. Sie hat jedoch keinen direkten Einfluss auf die Indexierung. Falls eine URL bereits indexiert wurde, bleibt sie trotz eines Ausschlusses in der robots.txt oft weiterhin im Index bestehen.Wird direkt im Quellcode der Seite hinterlegt und gibt der Suchmaschine präzise Anweisungen zur Indexierung und Linkverfolgung.
- Robots-Meta-Tag: Wird direkt im Quellcode der Seite hinterlegt und gibt der Suchmaschine präzise Anweisungen zur Indexierung und Linkverfolgung.
Unterschied zwischen Robots.txt und noindex
Der Hauptunterschied zwischen dem “noindex Tag” und “robots.txt” besteht darin, dass “noindex” spezifische Seiten von der Indexierung ausschließt, während der “disallow” Befehl in der “robots.txt” die Crawl-Aktivitäten der Suchmaschinen-Bots steuert. Mit anderen Worten, “noindex” kontrolliert, ob eine Seite in den Suchergebnissen erscheint, während “robots.txt” bestimmt, ob eine Seite überhaupt gecrawlt wird.
Gründe für die Verwendung von noindex
1. Vermeidung von Duplicate Content
Seiten mit doppelten oder sehr ähnlichen Inhalten können sich negativ auf das SEO auswirken.
2. Private oder sensible Inhalte
Seiten mit internen Unternehmensinformationen, Login-Bereichen oder Mitgliederseiten sollten nicht öffentlich im Index erscheinen.
3. Unwichtige oder temporäre Seiten
Landingpages für Ads, Danksagungsseiten nach einem Kauf oder Lead-Generierung-Seiten müssen oft nicht indexiert werden.
4. Thin Content oder automatisch generierte Seiten
Seiten mit wenig oder minderwertigem Inhalt, die keinen SEO-Wert haben, sollten aus dem Index ausgeschlossen werden.
5 Archiv- und Tag-Seiten
In Blogs oder Foren werden oft Tag- oder Kategorie-Seiten indexiert, die nur Sammlungen von Artikeln sind und keinen eigenständigen Wert haben.
7. Entwicklungs- und Testseiten
Staging- oder Testumgebungen sollten nicht von Suchmaschinen indexiert werden, um eine Verwirrung mit der Live-Version zu vermeiden.
Best Practice
Best Practice: Bei der laufenden Suchmaschinenoptimierung (SEO) sollte regelmäßig überprüft werden, ob das Setzen eines noindex sinnvoll ist. Seiten mit sensiblen oder irrelevanten Inhalten sollten mit noindex versehen werden, um eine gezielte Steuerung des Indexierungsverhaltens sicherzustellen.