Suche findet nicht alles

  • Affected Version
    WoltLab Suite 6.0
    Affected App
    WoltLab Suite Forum

    Ich habe einen bestimmten Beitrag von mir gesucht, der über folgende Such-Parameter nicht gefunden wird:

    • Begriff: background
    • in: Forum
    • Betreff und Nachricht
    • Suche nach Autor: Black Rider
    • [x] Nur Start-Beiträge finden

    Es werden zwar vier Beiträge gefunden, aber nicht der, den ich eigentlich suchte: Leere, aber dennoch große wcf1_background_job-Tabelle

    Ich konnte ihn erst finden, nachdem ich den Suchbegriff zu „groß“ geändert habe. Da aber „background“ nicht nur im Text vorkommt, sondern auch im Titel, ergibt das für mich keinen Sinn.

  • Hallo,

    mit WoltLab Suite 5.5 ist das Verhalten korrekt, denn der Beitrag enthält nicht das Wort „background“, sondern das Wort „wcf1_background_job“. Der Standard-Tokenizer von Elasticsearch betrachtet Unterstriche nicht als Wort-separator:

    Mit WoltLab Suite 6.0 sollte die Suche nach derartigen technischen Bezeichnern im Textinhalt durch einen neu eingeführten zweiten Tokenizer aber möglich sein, entsprechend setze ich das vorsichtig auf Bestätigt.

  • Tim Düsterhus August 21, 2023 at 4:19 PM

    Added the Label Confirmed
  • Hallo,

    Mit WoltLab Suite 6.0 sollte die Suche nach derartigen technischen Bezeichnern im Textinhalt durch einen neu eingeführten zweiten Tokenizer aber möglich sein, entsprechend setze ich das vorsichtig auf Bestätigt.

    Ich hatte die Funktionsweise falsch in Erinnerung: Der neue Tokenizer erkennt zwar alphanumerische Identifier mit Unterstrichen, Bindestrichen, Punkten und Doppelpunkten. Diese Token werden aber nur an Punkten in einzelne Token aufgetrennt, da Punkte das gängige Trennsymbol für „Namespaces“ sind und der primäre Einsatzzweck des Tokenizers die Erkennung von Domains ist.

    Eine zusätzliche Aufteilung an Unterstrichen ist nicht trivial, würde den Index weiter aufblasen und nur einen kleinen inkrementellen Mehrwert bieten. Entsprechend setze ich hier auf „Won't Fix“.

  • Tim Düsterhus August 22, 2023 at 2:43 PM

    Set the Label from Confirmed to Won’t fix

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!