Lucene Score Ergebnisse

stimmen
37

In Lucene, wenn Sie mehrere Indizes hatten, die jede nur eine Partition bedeckt. Warum hat die gleiche Suche auf verschiedene Indizes zurückgeht mit unterschiedlichen Noten? Die Ergebnisse von verschiedenen Servern exakt übereinstimmen.

das heißt, wenn ich nach:

  • Name - John Smith
  • DOB - 1934.11.11

Partition 0 zurückkehren würde eine Punktzahl von 0.345

Partition 1 zurückkehren würde eine Punktzahl von 0.337

Beide passen genau auf Namen und DOB.

Veröffentlicht am 02/08/2008 um 10:28
quelle vom benutzer
In anderen Sprachen...                            


3 antworten

stimmen
19

Das Scoring enthält die Inverse Document Frequency (IDF). Wenn der Begriff "John Smith" ist in einer Partition, 0, 100 - mal und in Partition 1, einmal. Die Punktzahl für John Smith Suche wäre höher Suche in Partition 1 , wie der Begriff mehr knapp ist.

Um diese Runde würden Sie welken haben Ihre Übersicht über alle Partitionen zu sein haben, oder Sie müssten die IDF außer Kraft setzen.

Beantwortet am 02/08/2008 um 10:51
quelle vom benutzer

stimmen
13

Da die Punktzahl auf dem Index bestimmt wird, wenn ich mich nicht ganz falsch.

Wenn Sie verschiedene Indizes (mehr / weniger oder andere Daten, die indiziert wurde) haben, wird die Punktzahl unterscheiden:

http://lucene.apache.org/core/3_6_0/scoring.html

(Achtung: Enthält Math :-))

Beantwortet am 02/08/2008 um 10:52
quelle vom benutzer

stimmen
8

Sie können auch in der Ausgabe des interessiert sein explain()Verfahren und das resultierende ExplanationObjekt , mit dem Sie eine Vorstellung davon, wie die Dinge erzielt werden, wie sie sind.

Beantwortet am 02/08/2008 um 21:03
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more