Hallo und guten Abend In der Google Search Console wurde ich auf doppel Content hingewiesen. Bei allen 3 Varianten landet man auf der Shopeingangsseite (Link nur für registrierte Nutzer sichtbar.) (Link nur für registrierte Nutzer sichtbar.) (Link nur für registrierte Nutzer sichtbar.) Die ersten beiden sind bei Google gelistet. Wie wird man jetzt am einfachsten die zweite und dritte Variante wieder los, auf was ist zu achten?
Hmm, blöder Fall. Beleuchten wir das kurz: https://www.meinshop.de/ Das ist eine reguläre URL, die sehen wir also als Positivfall. https://www.meinshop.de/?page=2 Hier haben wir die URL der Startseite mit einem angehängten GET-Parameter page. Der Page Parameter ist im Shop bekannt, aber für die Startseite ohne Funktion, damit ist die Gesamt URL so Murks. Die erste Frage ist wie der in den Google Index kommt, das sehe ich so zum ersten mal, könnte das auch nicht beantworten. Aus der Sitemap und Metatags kann der so nicht originär herauskommen. Der Shop ist in seiner jetzigen Variante aber andersrum auch nicht klug genug das zu reparieren. AB GX3.11 werden wir diesen Fall behandeln, und für eine Seite falsche Parameter fangen können, so dass sich dieses Problem mit dieser URL ab GX3.11 selbst heilt. Ich würde dir für jetzt anraten die URL über die Google Console aus dem Index entfernen zu lassen. https://www.meinshop.de/?sortcol=2&sortdir=a&ppp=7&page=3 Auch hier haben wir wieder eine irreguläre URL. Die Startseite mit 4 Parametern, aber nur den letzten (page) gibts überhaupt im Shop. Die anderen 3 (sortcol,sortdir,ppp) gibt es im ganzen Shop nicht. Das wird GX3.11 auch nicht heilen, der würde daraus die etwas weniger falsche Variante https://www.meinshop.de/?sortcol=2&sortdir=a&ppp=7 machen. Er würde also die ihm bekannten unsinnigen (hier page) abschneiden. Was auch GX3.11 nicht machen soll, ist unbekannte Parameter abschneiden, damit ist die geplante Änderung für dieses Problem keine Lösung. Das würde so einige externe Module beschädigen. Damit findet soweit keine automatische Lösung statt. Auch hier wäre erstmal wieder die Frage: Wie kommt die URL in den Google Index, wenn der Link so im Shop sicher nie gebaut wurde? Sehr schwer herauszukriegen und wohl ein individuelles Problem. Das zweite wäre: wie wird man das los? Auch hier hilft wie im vorherigen Fall die Webmaster Konsole bei Google. Das könnte nur wiederkommen, wenn im Web irgendwo ein wilder, falscher Backlink existiert, dem der Google Crawler folgen will. Wenn das Ding wiederkommt, würde ich alle 3 falschen Parameter in der robots Datei sperren.
Hallo Wilken, ich danke für die ausführliche Antwort, auch wenn ich nicht alles verstehe. Das Entfernen der Seiten (Link nur für registrierte Nutzer sichtbar.) (Link nur für registrierte Nutzer sichtbar.) habe ich in der Searchkonsole beantragt. Google meint aber „Ihre URLs werden vorübergehend aus den Suchergebnissen entfernt. Um Inhalte dauerhaft zu entfernen, müssen Sie die Quellseite entfernen oder aktualisieren“ Da kann man wohl gleich ans Blockieren in der robots.txt denken, oder? Wie genau müsste der Eintrag z.B. für (Link nur für registrierte Nutzer sichtbar.) aussehen? Für den Fall das mein erster Beitrag nicht ganz klar war. Als doppelte Metabeschreibungen werden in der Search Console die Seiten aufgeführt (Link nur für registrierte Nutzer sichtbar.) (Link nur für registrierte Nutzer sichtbar.) Im Google Index werden diese beiden Seiten angezeigt (Link nur für registrierte Nutzer sichtbar.) (Link nur für registrierte Nutzer sichtbar.) Gruß
Ich habe einen weiteren Link direkt zu meiner Startseite bei der Google Bildersuche entdeckt. Der funktioniert über verschiedene Artikelbilder, diese haben im Shop aber andere bzw. korrekte URLs (Link nur für registrierte Nutzer sichtbar.) Was mache ich jetzt mit dem? Wie heißt es so schön? Alle Wege führen nach Rom
Das sollte kein Problem sein. Ja, du müsstest da die Startseite sehen, aber der HTTP Statuscode wird 404 sein. Check mal.
Alle Links, die es im Shop so nicht mehr gibt, werden mit einem 404 versehen und landen auf der Startseite. Den Staus kannst Du nicht so auf der Seite sehen, sondern nur in der Console. Die öffnest Du in chrome oder FF z.B. mit der Taste F12.
Ich hatte bisher immer nur dass gesehen und bewertet was direkt auf der betreffenden Seite aufgetaucht ist. Das man da irgend wo im Hintergrund suchen kann und muss wußte ich nicht. War also ein Flunkern wider besseren Wissens.