Suchfunktion findet nur "alte" Beiträge

  • Affected App
    WoltLab Suite Forum

    Hallo,
    ich bin immer noch am Test für meinen Umstieg von phpBB3 auf WBB 4.1.3.

    Jetzt habe ich ein kleines Phänomen festgestellt. Ich werde nach dem Umstieg viele fehlerhafte interne Links haben, da die Struktur bei phpBB3 anders ist als bei WBB 4.
    Nun wollte ich in der WBB4 Testumgebung nach diesen internen Links suchen.

    Wenn ich jetzt im WBB 4.1.3 zum Beispiel nach viewtopic suche, was Bestandteil der "alten" Links ist, findet die Suche nur Beiträge bis 06.07.2014. Obwohl definitiv auch neuere Beiträge diesen Link Bestandteil enthalten.

    Suche ich nach der Domain ohne .de Endung sind es sogar nur Beiträge bis 07.05.2012.

    Eine Suche nach "http://www.domain.de/viewtopic.php?f=" findet auch neuere Beiträge mit diesen Links, aber immer noch nicht alle.

    Woran kann das liegen? Daran, dass es sich um Links handelt?

    Nutze ich "normale" Suchbegriffe, werden auch aktuelle Beiträge gefunden. Allerdings auch nicht immer. Beispiel Suchwort "DSLR", das kommt mit Sicherheit sehr oft vor, die Trefferliste enthält allerdings als neuesten Beitrag einen von 2011, aktuell wäre aber einer aus März 2015.

    Anzeigen wurden mehrfach aktualisiert, auch der Suchindex für Beiträge.


    Patrick

    Edited 2 times, last by PatrickS3: Rechtschreibung korrigiert. (April 16, 2015 at 8:56 AM).

  • Danke, das mit den 1000 Treffern ist bekannt.
    Aber selbst wenn ich die Suche auf ein Unterforum begrenze, wo mit Sicherheit maximal 200 Treffer kommen, habe ich nur alte Beiträge von 2011 oder 2013. Nichts von 2015.

  • Ja, die sind sortiert.

    Beispiel. Ich habe ein Unterforum, nennen wir es xyz.
    Wenn ich im WBB4 dort nach der Domain suche, erhalte ich 65 Treffer, der oberste und somit aktuellste ist vom 01.05.2012.

    Die gleiche Suche in meinem phpBB3 ergibt allerdings 141 Treffer, aktuellster und oberste Beitrag ist vom 05.04.2015.

    Mein phpBB3 nutzt übrigens auch fulltext mysql als Index (bei phpBB3 könnte man auch auf fulltext native umstellen).

  • Kann es evtl. sein, dass die Links vom Importer automatisch umgewandelt wurden und somit in der Form gar nicht mehr vorhanden sind (außer ein paar, die du noch findest)?

    Ansonsten habe ich auch keine Idee mehr.

  • Gleiches Problem hier, es werden nur alte Beiträge gefunden. Teilweise ist das Neuste von 2013, teilweise sogar von 2007, obwohl es definitiv sogar tagesaktuelle Beiträge gibt.

    • Official Post

    Das Problem kann bei Suchbegriffen auftreten, die sehr viele Ergebnisse liefern. Die Treffer werden automatisch nach 1000 Ergebnissen abgeschnitten und aus Performance-Gründen erst danach sortiert, was dazu führen kann, dass bei einem Suchbegriff, der deutlich über 1000 Ergebnisse liefert, nur ältere Treffer angezeigt werden. Leider stößt hier der Fulltext-Index von MySQL, der standardmäßig für die Suchfunktion genutzt wird, an seinen Grenzen.

    Wir testen intern gerade, ob man das Limit von 1000 Ergebnissen ohne große Performance-Einbußen hochsetzen kann (vermutlich auf einen Wert von 2000 - 3000). Alternativ empfiehlt sich für größere Foren der Einsatz von elasticsearch, für das wir in Kürze ein entsprechendes Plugin veröffentlichen.

  • Hallo Marcel, danke für die Rückmeldung.
    Kann ich nachvollziehen. Ich habe eben einen Test mit einem Suchbegriff gemacht, der "nur" 214 Treffer listet. Da ist dann alles da. Mit einem Begriff mit über 1000 Treffern fehlen wieder aktuelle.

    Wie gesagt, danke für die Rückmeldung.

    Patrick

  • Ich habe das Problem auch bei Suchbegriffen, die unter 1000 Treffer liefern, 984 Treffer beim Test eben…

    Dann sind es über 1.000 Treffer, denn die innere Abfrage ist auf 1.000 Datensätze begrenzt und erst im Anschluss kann exakt festgestellt werden ob diese auch vollständig zugänglich sind, daher die Diskrepanz.

  • Alles klar, Danke. Dann bin ich auf die Ergebnisse des internen Tests mit dem höheren Limit gespannt. Denn aktuell ist die Suche nahezu unbenutzbar. ;)
    Im Falle des Elasticsearch-Plugins, würde es damit auch irgendwelche Limits geben oder hat man damit dieses Problem überhaupt nicht?

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!