Indexierung & Crawling bei Google

Warum meine erste Website monatelang unsichtbar war (und was du daraus lernen kannst)

Ich muss das kurz beichten.
Meine erste Website war… online. Also technisch gesehen. Inhalt war da. Design war grausam (Frames. 2008. Frag nicht).
Und trotzdem: Niemand hat sie gefunden. Nicht meine Mutter. Nicht mein bester Kumpel. Nicht mal ich selbst bei Google.

Damals wusste ich noch nicht, dass ich gerade in einen dieser klassischen SEO-Fallen getappt bin:
Die Seite war nicht indexiert. Punkt. Aus. Ende.

Und genau darüber reden wir jetzt. Locker. Ehrlich. Mit kleinen Abschweifungen. Und ja, mit Crawling, Indexierung, Googlebot und all dem Zeug, das man eigentlich verstanden haben sollte, aber oft nur halb versteht. Geht mir bis heute manchmal so.

Was Crawling und Indexierung eigentlich sind (und warum Google nicht zaubern kann)

Was Crawling und Indexierung eigentlich sind (und warum Google nicht zaubern kann)

Lass uns einmal sauber anfangen. Also halbwegs.

Crawling bedeutet:
Google schickt seinen Googlebot los. Dieser Crawler besucht URLs, schaut sich Inhalte an, folgt Links, crawlt sich durch deine Seite. Wie ein leicht übermotivierter Praktikant mit zu viel Kaffee.

Indexierung bedeutet:
Google entscheidet danach, ob diese Seite in den Index aufgenommen wird. Also ob sie überhaupt eine Chance hat, in den Suchergebnissen aufzutauchen.

Und ja, Crawling und Indexierung sind zwei verschiedene Dinge. Das habe ich auch erst nach ein paar Fehlversuchen wirklich kapiert. Eine Seite kann gecrawlt sein, aber nicht indexiert. Klassiker.

Oh, und bevor ich’s vergesse:
Crawling ≠ Ranking. Ranking kommt viel später. Erst mal musst du überhaupt existieren.

Warum Google deine Seite nicht indexiert (auch wenn du alles richtig findest)

Warum Google deine Seite nicht indexiert (auch wenn du alles richtig findest)

Jetzt wird’s kurz unangenehm.
Denn Google indexiert nicht alles. Wirklich nicht. Auch wenn du denkst, dein Content ist mega.

Häufige Gründe:

  • Duplicate Content (ja, auch der „leicht angepasste“ Text)
  • fehlerhafte Weiterleitungen
  • eine blockierende robots.txt
  • noindex-Tags (passiert öfter als man denkt…)
  • dünner oder nicht relevant wirkender Content
  • anfragen für dieselbe url mit zig Parametern

Und manchmal… passiert einfach nix.
Google schaut, zuckt mit den Schultern und denkt sich: „Nee.“

Ich hatte mal eine neue Seite, die lag wochen dauern einfach brach. Seite gecrawlt, aber nicht im Index. In der Google Search Console stand sinngemäß: „Gesehen, aber aktuell nicht indexiert“. Danke für nichts.

Kurzer Realitätscheck: Wie Google Seiten überhaupt entdeckt

Kurzer Realitätscheck Wie Google Seiten überhaupt entdeckt

Google findet neue Seiten auf drei Arten:

  1. Interne Verlinkung
  2. Externe Links
  3. Sitemap

Das war’s. Kein Zauber. Keine Magie.

Wenn du eine neue Seite hast und sie nirgendwo verlinkt ist, dann… ja. Dann sieht Google sie nicht. Punkt.

Und hier kommt die XML-Sitemap ins Spiel. Die signalisiert Google:
„Hey, das hier sind meine Seiten deiner Website. Guck mal rein.“

Kleiner Side-Rant:
Und fang mir bloß nicht mit Leuten an, die 5.000 URLs in eine Sitemap klatschen, obwohl 80 % davon Müll sind. Das hilft niemandem. Schon gar nicht dem Crawl Budget.

Googlebot, Crawler, Spider… warum so viele Namen?

Kurzer Einschub, weil das immer wieder Verwirrung stiftet.

  • Googlebot ist Googles eigener Webcrawler
  • Crawler, Spider, Bots sind Oberbegriffe
  • Webcrawler klingt technisch, meint aber dasselbe

Wenn also jemand sagt „der Spider crawlt deine Seite“, dann meint er:
Ein Bot besucht deine URL und schaut sich den Content an. Mehr nicht.

(Ja, ich weiß, Spider klingt dramatischer.)

Crawling durch den Googlebot: Was dabei wirklich passiert

Der Googlebot besucht eine Seite.
Er schaut sich an:

  • HTML-Struktur
  • interne Links
  • Ladezeit
  • mobile Version
  • Inhalte
  • Meta-Daten

Dann entscheidet Google, ob diese Seite relevant genug ist, um sie zu indexieren.

Und nein, das passiert nicht sofort.
Es kann tage oder sogar wochen dauern, bis eine neue oder aktualisierte Seite im Index landet. Besonders bei kleinen Seiten ohne Autorität.

Ich hab mir früher ständig das Datum des letzten Crawlings angeschaut. Als würde das irgendwas beschleunigen. Spoiler: tut es nicht.

Google Search Console: Dein bester Freund und größter Nervfaktor

Wenn du SEO machst und die Google Search Console nicht nutzt, dann… weiß ich auch nicht. Ehrlich.

Zwei Dinge sind hier Gold wert:

  • das URL-Prüftool in der Google Search Console
  • die Sitemap in der Google Search Console

Du kannst dort:

  • sehen, ob eine Seite indexiert ist
  • prüfen, ob sie gecrawlt wurde
  • eine Indexierung beantragen
  • Fehler erkennen (oder neue Sorgen)

Kleiner Funfact:
„Indexierung einreichen“ bedeutet nicht „sofortige Indexierung“. Es bedeutet nur: Hey Google, guck dir das bitte mal an. Mehr nicht.

Seite nicht indexiert? Das kannst du konkret tun

Jetzt wird’s praktisch. So halb.

Wenn eine Seite nicht indexiert ist, prüfe:

  1. Ist sie in der robots.txt blockiert?
  2. Gibt es ein noindex?
  3. Ist sie intern verlinkt?
  4. Taucht sie in der Sitemap auf?
  5. Ist der Content hochwertig oder eher… naja?

Und dann kannst du:

  • die Seite aktualisieren
  • bestehende Inhalte aktualisiert einbauen
  • interne Verlinkung verbessern
  • die URL erneut einreichen

Aber Achtung:
Optimieren heißt nicht „Text aufblasen“. Google merkt das. Leider.

Indexierung beschleunigen: Geht das überhaupt?

Kurze Antwort: Jein.

Du kannst die Indexierung beschleunigen, indem du:

  • neue oder aktualisierte Inhalte intern stark verlinkst
  • die Sitemap sauber hältst
  • relevante Inhalte veröffentlichst
  • technische Fehler vermeidest

Aber du kannst Google nicht zwingen.
Es gibt keine echte sofortige Indexierung. Alles andere ist Marketing-Gelaber.

(Ja, auch diese ominösen Fiverr-Gigs. Nein. Einfach nein.)

Crawl Budget: Erst wichtig, dann plötzlich sehr wichtig

Für kleine Seiten ist das Crawl Budget meist egal.
Für große Websites: absolute Grundlage.

Google crawlt nicht unendlich.
Wenn du tausende URLs hast, entscheidet Google, welche Seiten wichtig sind.

Deshalb:

  • unwichtige Seiten blockieren
  • wichtige Seiten sauber verlinken
  • duplicate content vermeiden
  • fehlerhafte URLs aufräumen

Insbesondere bei großen Websites ist das der Unterschied zwischen Sichtbarkeit und Chaos.

Typische Denkfehler, die ich selbst gemacht habe

Oh ja. Einige.

  • „Google findet das schon.“
  • „Mehr Content hilft immer.“
  • „Wenn gecrawlt, dann auch indexiert.“
  • „Eine Sitemap reicht.“

Nein. Tut es nicht.
SEO ist kein Wunschkonzert. Leider.

Ich erinnere mich noch an ein Projekt, da war die bevorzugte Seite falsch gesetzt. Google indexiert brav… aber die falsche URL. Wochenlang. Hat richtig Spaß gemacht.

Kurze Abschweifung: Popkultur, aber SEO

Ich schwöre, SEO fühlt sich manchmal an wie diese Serien, wo alle denken, sie hätten den Plan verstanden… und dann kommt Staffel 3.

Oder wie dieses Meme:
„I fixed one bug and now there are three new ones.“

Indexierung ist genau so.

Warum Sichtbarkeit bei Google kein Zufall ist

Wenn deine Seiten im Google Index sind, dann hast du die Eintrittskarte. Mehr nicht.

Sichtbarkeit entsteht durch:

  • relevante Inhalte
  • saubere Indexierung deiner Seite
  • konsistentes Crawling
  • technische Sauberkeit
  • Geduld (ugh)

Google indexiert nicht, um nett zu sein.
Google indexiert, wenn es Sinn ergibt.

Wenn du beim Thema Crawling, Indexierung und dem ganzen technischen Kram gerade merkst, dass du irgendwo zwischen „Ich hab’s fast“ und „Warum macht Google das“ hängst, dann gönn dir ruhig noch ein bisschen Kontext: In technisches SEO für Selbstständige geht’s einmal quer durch die wichtigsten Stellschrauben (ohne dass du danach direkt dein CMS anzünden willst). Und falls du eher so der Typ „Bitte einmal einfach, ich hab heute schon genug gedacht“ bist, ist technisches SEO einfach erklärt genau das Richtige. Ach, und weil Google bei Crawling und Indexierung inzwischen super stark auf die mobile Version schaut: mobile SEO als Rankingfaktor ist so ein Artikel, der dir unangenehm ehrlich zeigt, wo man sich mit Handy-Ansicht und Ladezeit ganz schnell selbst ein Bein stellt.

Zum Schluss, ganz ehrlich

Ich mache SEO seit 2008.
Und trotzdem sitze ich manchmal da, starre auf die Search Console und denke:
„Wann Google?“

Indexierung bei Google ist kein Hexenwerk.
Aber sie ist auch kein Selbstläufer.

Wenn du bis hier gelesen hast:
Hast du gerade ein Indexierungsproblem? Oder schon mal eins gehabt, das dich wahnsinnig gemacht hat?

Wenn dir dieses wirre Gedankending gefallen hat, schau dir vielleicht auch meine anderen Sachen an. Kein Druck. Wirklich nicht.