Falsche Canonical Links im Shop

Thema wurde von PHI, 4. Mai 2020 erstellt.

  1. PHI

    PHI Erfahrener Benutzer

    Registriert seit:
    23. März 2012
    Beiträge:
    398
    Danke erhalten:
    26
    Danke vergeben:
    134
    Guten Morgen,

    wir haben in der Google Console Meldungen das wir Double Content haben.
    Weiß eventuell jemand, weshalb solche Links im Shop produziert werden und fehlerhaft im System gespeichert werden ?




    upload_2020-5-4_8-36-33.png


    upload_2020-5-4_8-36-48.png


    upload_2020-5-4_8-36-59.png

    Gruß aus den Niederlanden

    PHI Essences
     
  2. Wilken (Gambio)

    Wilken (Gambio) Erfahrener Benutzer

    Registriert seit:
    7. November 2012
    Beiträge:
    18.737
    Danke erhalten:
    7.309
    Danke vergeben:
    2.208
    Der canonical Tag ist falsch, weil du deine Seite über eine falsche URL aufrufst und damit nicht mehr als ein Folgefehler. Man sieht in deiner Url Leiste in deinem Screenshots auch, dass du deine Seite schon mit diesen merkwürdigen Anhängseln aufrufst. Aufgrund anderer Designentscheidungen kann der Shop das dann nicht wegfiltern, das lässt sich nicht ändern ohne so einige externe Module kaputtzumachen.

    Deine eigentliche Frage muss daher sein: Warum genau werden Seiten mit dem ganzen Mist nach dem Fragezeichen aufgerufen. Die Antwort kann ich dir wahrscheinlich auch sagen: Deine Sprachumschaltung per Flaggen oben in deiner Seite. Das bauen wir immer wieder Leuten aus, weil es Crawler irre macht, und nur welche mit haben diesen Ärger immer mal wieder.
     
  3. PHI

    PHI Erfahrener Benutzer

    Registriert seit:
    23. März 2012
    Beiträge:
    398
    Danke erhalten:
    26
    Danke vergeben:
    134
    #3 PHI, 4. Mai 2020
    Zuletzt bearbeitet: 4. Mai 2020
    Ja Danke für die Antwort. Die Problematik bestand darin die Rumänische Flagge einzubauen, müsste dann umgebaut werden. Das zweite Problem ist, ich merke das man häufig bei Gambio mit den Fragen weggeschmettert wird, ohne sich die Sache richtig anzugucken. Laut Gambio Support würde das alles nicht auftreten, diese Links würde es nicht geben und der Shop würde diese Links auch nicht produzieren, haben schon mehrfach nachgefragt.

    Also wo ist dann der Fehler, der Shop produziert doch die Links, nicht google ???? Wie können wir das Problem lösen ?

    Wir rufen nicht diese kaputten Links auf. Diese Links gibt die Google-Console als Fehlermeldung "Double Content" aus.

    PS: Das ist der Quelltext aus dem Shop.

    Viele Grüße aus den Niederlanden.
     
  4. Wilken (Gambio)

    Wilken (Gambio) Erfahrener Benutzer

    Registriert seit:
    7. November 2012
    Beiträge:
    18.737
    Danke erhalten:
    7.309
    Danke vergeben:
    2.208
    Das stimmt normal nicht, manchmal liegt nur die Ursache für ein Problem doch ziemlich auf der Hand, und dann gibts ne klare Aussage.

    Die Aussage vom Support stimmt: Der Shop produziert keine solchen Links. Es ist was anderes wenn jemand im Code schlechte Anpassungen selbst einbaut, denn man kann im Eigenhosting ja alles selbst ändern.

    Google produziert Links. Der Crawler liest Seiten und versucht daraus zu lesen was es noch geben könnte. Gibt man den Crawler ausreichend schlechte Indizien läuft der Amok.

    Was dafür spricht das ausreichend schlechte Indizien vorhanden sind.

    Das tut nix zur Sache. Das kommt 1:1 aus der URL Bar und wird nur übernommen. Nicht Folgefehler für den Ursprung halten.

    Und die Ursache des ganzen Frusts: Das kommt jede Wette aus dem Umbau mit den Sprachflaggen, das wird einfach nicht gut gemacht sein.
     
  5. PHI

    PHI Erfahrener Benutzer

    Registriert seit:
    23. März 2012
    Beiträge:
    398
    Danke erhalten:
    26
    Danke vergeben:
    134
    Guten Tag Herr Wilken, wir hatten mindestens 1-2 Jahre das Problem das die Standard-Sprachen nicht auswählbar waren, von daher kam der Tip vom Herrn Kratzke, dies als Notlösung so umzusetzen, ist das nicht richtig ?



    Datum
    22.02.19 08:26 Uhr
    Mitarbeiter
    Jan-Olof Kratzke
    Betreff
    Re: Permanenter Fehler mit den Sprachen
    Guten Tag,

    vielen Dank für Ihre Rückmeldung. Gerne erwarten wir Ihre Antwort bezüglich des Videos.

    Alternativ besteht die Möglichkeit eine eigene Sprachauswahl in einer der Zusatzboxen selbst zusammenzustellen. Hier können z.B. Landesflaggen als Bilder platziert und verlinkt werden. Als Link kann hierbei Ihre Shop-URL mit dem entsprechenden Länderkürzel als Zusatz angegeben werden:

    https://shop.phiessences.com/de
    https://shop.phiessences.com/en
    https://shop.phiessences.com/fr
    https://shop.phiessences.com/es

    Die Zusatzboxen können im Content Manager bearbeitet werden, Details hierzu finden Sie in unserem Handbuch unter folgendem Link:

    https://developers.gambio.de/manual.html?section=content_manager_elemente

    Die notwendigen Schritte zum Hochladen und Verlinken von Bildern sind in den nachfolgenden Unterkapiteln des CK-Editors beschrieben:

    https://developers.gambio.de/manual.html?section=bilder_einbinden
    https://developers.gambio.de/manual.html?section=link_einfuegen_editieren

    Mit freundlichen Grüßen
    Jan-Olof Kratzke
     
  6. Wilken (Gambio)

    Wilken (Gambio) Erfahrener Benutzer

    Registriert seit:
    7. November 2012
    Beiträge:
    18.737
    Danke erhalten:
    7.309
    Danke vergeben:
    2.208
    Ich weiss nicht was das Problem da im Shop war, als allgemeiner Bug war da nichts bekannt. Der Workaround wäre ok, wäre es denn so gemacht, das wars aber ja nicht. Jetzt ist da bei dir im Shop die Umschaltung doppelt: einmal fraglich wie es immer gewesen ist, einmal neu so einfach wie der Kollege es vorschlug.
     
  7. Anonymous

    Anonymous Erfahrener Benutzer

    Registriert seit:
    19. Juni 2012
    Beiträge:
    4.831
    Danke erhalten:
    1.122
    Danke vergeben:
    947
    Das Thema wird Gambio verfolgen, bis sie endlich zu einer gängigen und sinnvollen Implementierung von canonical URLs kommen. Eine, die von allen gängigen SEO Agenturen und von Google selbst empfohlen wird. JEDE aufgerufene Url als Canonical zu definieren ist einfach grober Unfug und nicht im Sinne des canonical Tag Erfinders, auch wenn das vielleicht bei Parametern, die dem Shop bekannt sind, in Kombination mit der robots.txt funktioniert.

    Ich lese alle paar Monate wieder Probleme im Forum, die genau auf diesen Unfug zurückzuführen sind.

    Btw, neue bisher unentdeckte Ausprägung des Problems:

    (Link nur für registrierte Nutzer sichtbar.){1}1{2}75_t-shirt-mit-schal-kragen.html&no_boost=1

    Ist Canonical URL, soll laut meta tagi ndexiert werden und ist auch in der robots.txt nicht gesperrt. Und je nach Anzahl der Variationen hat man eine Handvoll oder ein paar Hundert duplicate content URLs, die alle canonical sind.

    Sucht mal in google nach "no_boost=1" und schaut euch die ganzen fälschlicherweise indexierten Produktseiten von einigen hundert Shops an...

    Und wenn ihr die Lücke im nächsten Update stopft, dann kommt in 3 Monaten der nächste Fall.

    Wann kommt denn endlich die offene Whitelist-Lösung für URL-Parameter in Canonical URLs? Wenn sie offen ist, greift auch das Kompatibilitätsargument für Drittanbieter-Module nicht mehr.
     
  8. Anonymous

    Anonymous Administrator
    Mitarbeiter

    Registriert seit:
    26. April 2011
    Beiträge:
    1.668
    Danke erhalten:
    1.263
    Danke vergeben:
    300
    Das kann ich in dem genannten Testshop nicht reproduzieren. Wenn ich die URL mit all diesen Parametern aufrufe steht im Canonical (Link nur für registrierte Nutzer sichtbar.)

    Die anderen Parameter der Varianten sind in der Canonical URL nicht enthalten und führen daher auch nicht zu doppelten Content. Aber das hier das no_boost=1 angehängt wird, ist tatsächlich falsch. Das nehme ich als Bug auf.
     
  9. Anonymous

    Anonymous Erfahrener Benutzer

    Registriert seit:
    19. Juni 2012
    Beiträge:
    4.831
    Danke erhalten:
    1.122
    Danke vergeben:
    947
    Aber Till, du kannst ja mal dies hier aufrufen:

    (Link nur für registrierte Nutzer sichtbar.)

    Das wird auch Canonical URL, weil der Parameter potenzmittel nicht in der robots.txt gesperrt ist und zuverlaessigkeit auch nicht. Wenn ich darauf einen Link setze, wird das auch indexiert. Deswegen: Warum nicht eine offene Whitelist, die jeder Shopbetreiber und Modulentwickler erweitern kann?
     
  10. mmatecki

    mmatecki Erfahrener Benutzer

    Registriert seit:
    24. Juni 2018
    Beiträge:
    644
    Danke erhalten:
    110
    Danke vergeben:
    69
    Wo her hat google denn aus meine SHOP diese URL gecrawlt?

    /product_info.php?info=p90336_alsafix-da-brads-50-mm-aluminium.html&no_boost=1


    /product_info.php?info=xxxxxxxxxxxxxxxx.html&no_boost=1

    die werden ständig in meinem Shop von Google gecrawlt, siehe Anhang
     

    Anhänge:

  11. Anonymous

    Anonymous Erfahrener Benutzer

    Registriert seit:
    19. Juni 2012
    Beiträge:
    4.831
    Danke erhalten:
    1.122
    Danke vergeben:
    947
    So sieht der Link aus wenn man im Warenkorb auf einen Artikel klickt. Aber es gab zwischen Version 4.2 und 4.4 auch einen Bug, dass Artikellinks auf der Startseite so waren. Nicht geboostet. Wenn so was dann gleichzeitig noch canonical URL ist und du Pech hast, indexiert Google die deswegen prioritär.
     
  12. mmatecki

    mmatecki Erfahrener Benutzer

    Registriert seit:
    24. Juni 2018
    Beiträge:
    644
    Danke erhalten:
    110
    Danke vergeben:
    69
    Naja die sind noch nicht im Index von Google dafür sind diese im Index

    https://www.sus-verbindungstechnik.de/?manufacturers_id=10&XTCsid=m5ja6k2cncd57s3il89nomm9s6&page=9
    https://www.sus-verbindungstechnik.de/?XTCsid=mlvc6n105keabja38soavvj2m5


    Hab die einträge dazu bereits in der robots gelöscht aber bisher ohne größeren erfolg.

    das sind doch seiten die google aus cache fischt?
     
  13. Anonymous

    Anonymous Erfahrener Benutzer

    Registriert seit:
    19. Juni 2012
    Beiträge:
    4.831
    Danke erhalten:
    1.122
    Danke vergeben:
    947
    Auch ein Bug, dass die XTCsid indexiert werden darf. Habe ich in der Roadmap gesehen, ist entweder in 4.4 gefixt oder kommt in 4.5. Alles Symptombekämpfung für ein und die selbe Ursache. Du solltest die XTCsid vorübergehehend in der Robots.txt sperren. Und evtl eine Weiterleitung einrichten. Bin nicht 100% sicher, aber ich glaube, für den unwahrscheinlichen Fall dass da eine Admin Session im Index landet, die noch aktuell ist, hat derjenige sogar Zugriff auf deinen Admin...
     
  14. mmatecki

    mmatecki Erfahrener Benutzer

    Registriert seit:
    24. Juni 2018
    Beiträge:
    644
    Danke erhalten:
    110
    Danke vergeben:
    69
    Die XTCsid ist ja von hause aus in der robots gesperrt, hat ja nix gebracht, also kannst nur alles aufmachen und den eintrag in der robots löschen damit der bot beim noindex der seiten aufläuft, aber das dauert ne ewigkeit
     
  15. Anonymous

    Anonymous Erfahrener Benutzer

    Registriert seit:
    19. Juni 2012
    Beiträge:
    4.831
    Danke erhalten:
    1.122
    Danke vergeben:
    947
    Bei uns sind schon seit Jahren alle Carnival URLs komplett Parameter-los. Ich halte das für richtig und habe noch keine Probleme festgestellt. Ich kenne auch keinen Gambio -Parameter der dem Seiteninhalt derart bedeutsam verändert, dass ich eine zusätzliche Indexierung für sinnvoll halte. Außer vielleicht die manufacturers_id und die filter_id - die aber im Standard beide von Gambio im Standard gesperrt werden.
     
  16. Anonymous

    Anonymous Erfahrener Benutzer

    Registriert seit:
    19. Juni 2012
    Beiträge:
    4.831
    Danke erhalten:
    1.122
    Danke vergeben:
    947
    (Link nur für registrierte Nutzer sichtbar.)
     
  17. PHI

    PHI Erfahrener Benutzer

    Registriert seit:
    23. März 2012
    Beiträge:
    398
    Danke erhalten:
    26
    Danke vergeben:
    134
  18. Anonymous

    Anonymous Erfahrener Benutzer

    Registriert seit:
    19. Juni 2012
    Beiträge:
    4.831
    Danke erhalten:
    1.122
    Danke vergeben:
    947
    #18 Anonymous, 21. Mai 2021
    Zuletzt bearbeitet: 21. Mai 2021
    Na ja, bei dir ist die Sache ja, dass du dich mit dem Problem meldest und dann die Lösungsvorschläge nicht ausprobierst. Das war ein anderer Thread, aber ich meine im Kopf zu haben, dass gleich 3 Leute Ratschläge gegeben hatten, was zu tun ist?
    (Link nur für registrierte Nutzer sichtbar.)
     
  19. PHI

    PHI Erfahrener Benutzer

    Registriert seit:
    23. März 2012
    Beiträge:
    398
    Danke erhalten:
    26
    Danke vergeben:
    134
    Die Lösungsvorschläge sind alle ausprobiert, die sind alle im Sande verlaufen, da es damit nicht gelöst werden konnte. Trotz Sitemap durchforstet google noch falsche Canonical Links.
     
  20. Kai Schoelzke

    Kai Schoelzke Beta-Held

    Registriert seit:
    30. März 2016
    Beiträge:
    3.804
    Danke erhalten:
    548
    Danke vergeben:
    248
    Wenn irgendwo auf deiner Seite Links mit Parametern sind, wird das immer wieder passieren.