pageNo=1 löschen

  • App
    WoltLab Suite Forum

    Hallo Forum,


    Kleinkram.


    Die Webmastertools spammen mir mal wieder die Logs voll mit eigentlich leicht abstellbaren "Fehlern" in der Frontend-Ausgabe.

    Konkret geht es um die Blätterfunktion. Hier wird für Seite 1 pageNo=1 angehangen. Korrekt bzw. besser wäre allerdings, wie als kanonische URL hinter dem Link dann auch angegeben, die jeweilige erste Seite ganz ohne pageNo in der URL, oder?

    Lässt sich das irgendwie abstellen oder besteht die Hoffnung, dass bei einer Blätterfunktion in einer zukünftigen Version pageNo=1 aus dem Link 1 verschwindet, wenn er ohnehin nicht notwendig ist?


    Schöne Grüße,

    Armin

  • Du kannst in den Webmaster Tools Parameter definieren, die ignoriert werden sollen. Ich weiß allerdings gerade nicht, wo genau das ging.

  • Du kannst in den Webmaster Tools Parameter definieren, die ignoriert werden sollen. Ich weiß allerdings gerade nicht, wo genau das ging.

    Ja leider eben nicht mehr. X/

    Davon ab wäre es fatal Google die Variable pageNo ignorieren zu lassen, es geht ja um die Variable mit dem Wert 1.

  • Naja, man springt auf die erste Seite, insofern ist der Parameter durchaus passend. Der vermeintliche Widerspruch zwischen Aufruf des Beginn eines Themas und Aufruf der ersten Seite eines Themas wird aufgelöst.

    Code
    <link rel="canonical" href="https://www.woltlab.com/community/thread/218145-smalltalk-labern-reden-diskutieren/">
  • Nun, ich weiß nicht, wie ich das noch eindeutiger formulieren könnte. Was soll mir der Canonical-Code jetzt sagen? Davon spreche ich doch?! Das Forum verlinkt (immer) in der Blätterfunktion auf eine Seite, die einen anderen kanonischen Link hat. Warum verlinkt sie nicht direkt auf die richtige Seite?

    Mir lag nicht an der Ergründung des Parameters, der, ob man ihn mit Wert 1 hat oder weglässt, exakt dasselbe Ergebnis liefert (also überflüssig ist). "Alternative Seite mit richtigem kanonischen Tag" ist bei mir auf über 50.000 angewachsen. Natürlich kann man jetzt die komplette Liste als Excel runterladen, alle pageNo=1 Einträge rauslöschen um dann eine Liste zu bekommen, die man eigentlich braucht. Man könnte ein Problem, das man ohne Mehrwert erzeugt, auch einfach lassen, oder?

  • Die Webmastertools handeln völlig logisch: Da werden (bei mir) vom Forum 49.000 Links auf Seiten produziert, die aber eine andere kanonische URL haben, also -> Alternative Seite mit richtigem kanonischen Tag. Warum nicht direkt den richtigen Link? Es gibt keine Notwendigkeit für die Software, dies zu tun, nur Bequemlichkeit in der Programmierung. Da ist einfach eine for Schleife die von 1 auf x durchläuft. Die 1 abfangen bzw bei 2 anfangen und 1 ohne pageNo Angabe ausgeben, hätte halt 2 Zeilen mehr Quellcode bedeutet. Für den Nutzer ändert sich gar nichts, aber das logfile würde nicht volllaufen.


    Wie gesagt: Kleinigkeit. Aber in der Hoffnung, dass die Entwickler davon Notiz bekommen und einen Moment darüber nachdenken.

  • Ich kann das genannte Problem nicht reproduzieren. Google schließt die betroffenen Seiten aus und nimmt stattdessen die Seite, die als kanonische URL hinterlegt ist.


    "Duplikat – Google hat eine andere Seite als der Nutzer als kanonische Seite bestimmt".

  • Oh je, bei "Duplikat – Google hat eine andere Seite als der Nutzer als kanonische Seite bestimmt" wären wir direkt beim nächsten Problem. Das meint aber was anderes, als "Alternative Seite mit richtigem kanonischen Tag", denn hier ist aufgelistet, wo Google selbst entschieden hat und nicht die Einstellung der Software übernommen hat. Ich traute mich gar nicht, das anzusprechen.


    Alternative Seite mit richtigem kanonischen Tag = Software hat angegeben, dass ein anderer Link der kanonische ist

    Duplikat – Google hat eine andere Seite als der Nutzer als kanonische Seite bestimmt = Google entscheidet, dass eine andere URL die kanonische ist wg. Duplicate Content


    Das Problem ist dann auch etwas weniger klein, weil es nicht nur ein nervendes logifle-Problem ist: Google ignoriert bei mir mitunter die pageNo Variable und entscheidet willkürlich, sowohl in Boards, wie auch Threads, um:

    Code
    Vom Nutzer angegebene kanonische URL
    https://www.drachenforum.net/thread/85409-4-wolsing-fliegen-in-spo-kw29-30-2014/?pageNo=11
    Von Google ausgewählte kanonische URL
    https://www.drachenforum.net/thread/85409-4-wolsing-fliegen-in-spo-kw29-30-2014/
    
    Vom Nutzer angegebene kanonische URL
    https://www.drachenforum.net/board/3-flugreviere/?pageNo=107
    Von Google ausgewählte kanonische URL
    https://www.drachenforum.net/board/3-flugreviere/

    Ganz unangenehm wird es hier:

    Code
    Vom Nutzer angegebene kanonische URL
    https://www.drachenforum.net/thread/63994-alternative-zur-ozone-turbo-bar/?pageNo=4
    Von Google ausgewählte kanonische URL
    https://www.drachenforum.net/thread/63994-alternative-zur-ozone-turbo-bar/?postID=1182743

    ?pageNo und ?postID zeigt wenn es dumm läuft halt denselben Inhalt. Deshalb landet das ja unter "Duplikat". Nur entscheidet Google mies, weil uneindeutig. Im Grunde, so zumindest meine Auffassung, darf die Software es gar nicht dazu kommen lassen.

    https://www.drachenforum.net/board/3-flugreviere/107/ bliebe m.E. der Königsweg. Und der Sprungmarkenlink sollte immer mit Seitenangabe und # sein, auch wenn es softwareseitig aufwändiger ist: https://www.drachenforum.net/thread/63994-alternative-zur-ozone-turbo-bar/6/#1182743.

  • Man muss auch nicht alles tot reden. Wenn es Optimierungspotential gibt und es keine technischen Gründe dagegen gibt (das kann ich nicht beurteilen), dann ist das ein valider Vorschlag und dein Augenrollen unangebracht. Ich freue mich jedenfalls auch über kleine Optimierungen, da sich viele kleine Verbesserungen auch addieren und vielleicht irgendwann bezahlt machen.

  • Ich habe darauf aufmerksam machen wollen, dass die programmiertechnisch bequeme Verlinkung ("kanonische URL wird's schon richten") von Inhalten unter Verwendung der genannten _GET Variablen problematisch werden kann und das begründet. Ich habe Beispiele geliefert die das auch praktisch zeigen.


    "Duplikat – Google hat eine andere Seite als der Nutzer als kanonische Seite bestimmt" meint natürlich etwas anderes und ist eigentlich eindeutig beschrieben. Es ist doch ein Unterschied ob die Software Google sagt, dass eine andere URL als die aufgerufene/verlinkte die kanonische URL hat (das ist gewolltes Verhalten), oder ob Google entscheidet dass eine von der Software ausgespuckte kanonische URL ignoriert wird und stattdessen Google eine andere nimmt?


    Beispiel/Ergebnis:

    Code
    Vom Nutzer angegebene kanonische URL
    https://www.drachenforum.net/thread/85409-4-wolsing-fliegen-in-spo-kw29-30-2014/?pageNo=11
    Von Google ausgewählte kanonische URL
    https://www.drachenforum.net/thread/85409-4-wolsing-fliegen-in-spo-kw29-30-2014/
    
    Vom Nutzer angegebene kanonische URL
    https://www.drachenforum.net/board/3-flugreviere/?pageNo=43
    Von Google ausgewählte kanonische URL
    https://www.drachenforum.net/board/3-flugreviere/

    Und noch ein wtf Beispiel:

    Code
    Vom Nutzer angegebene kanonische URL
    https://www.drachenforum.net/board/6-drachenbau-drachentuning-reparatur/?pageNo=5
    Von Google ausgewählte kanonische URL
    https://www.drachenforum.net/board/6-drachenbau-drachentuning-reparatur/?tagID=1555

    Und tausende URLs mehr. Ich glaube wir reden aneinander vorbei. Wenn das völlig korrekt sein soll dass Google die Unterseiten von Threads nicht indexiert, weil es findet dass nur die erste Seite die Gültige ist oder ein Thema mit 15 Seiten also nur 3 Seiten indexiert bekommt und für alle anderen die Hauptseite als kanonische auswählt oder irgendwas getaggtes, bin ich einfach zu schwerfällig das zu verstehen. ;)


    ... im Grunde ging es mir aber erstmal nur darum dass das bequeme pageNo=1 gegebenenfalls überdacht wird, weil es ohne Not dauerhaft die logs vollspamt.

  • Das ist mal stark von der Website und ihrer Aufbereitung der Inhalte abhängig. Wenn Du zu diesem Eindruck gelangst, ist das ein amüsantes Eigentor. ^^


    Den ggf. dennoch sachlich am Thema interessierten: Ich habe das jetzt erstmal so gelöst, dass ich verschiedene Seiten über die robots.txt ausklammere, Google also hoffentlich gar nicht erst auf die Idee kommt, diese selbstständig als kanonische URL festzulegen:

    Code
    Disallow: /*?postID
    Disallow: /*?userID
    Disallow: /*?tagID
    Disallow: /*?action
    Disallow: /*?sortField
    Disallow: /*?types
    Disallow: /*findUserThreads
    Disallow: /*label

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!