2009-10-07 18 views
7

Sé que toma un flotador, pero ¿cuáles son algunos valores típicos para varios niveles de potenciación dentro de un resultado?Lucene/Lucene.NET - Document.SetBoost() valores?

Por ejemplo:

Si quisiera aumentar la ponderación de un documento en un 10%, entonces yo debería configurarlo 1.1? ¿Por 20% luego 1.2?

¿Qué sucede si empiezo a establecer aumentos en valores como 75.0? o 500.0?

Editar: Fijo Formateo

Respuesta

6

Por favor ver la Lucene Similarity Documentation para la fórmula. En principio, si todos los demás factores permanecen iguales, establecer un aumento de documento a 1.1 le otorgará un puntaje 10% más alto en comparación con un documento idéntico con un aumento de 1.0. Si tiene un conjunto de documentos que deberían ser intrínsecamente preferidos en las búsquedas, puede ser una buena idea. Tenga en cuenta que Document Boost es un atributo de tiempo de indexación, por lo que es imposible cambiar el impulso del documento sin reindexarlo. Hay otros factores importantes en la puntuación, incluidos los puntajes de los partidos a término, las normas, etc. Consulte Debugging Relevance Issues in Search para obtener más información.

+1

Pero tenga en cuenta que los aumentos de documentos y de campo terminan codificados en un solo byte, con una mantisa de 3 bits, por lo que cualquier diferencia inferior al 25% puede terminar completamente desapercibida. – jsalvata

2

Agregando a lo que Yuval ha dicho. Este valor es función del impulso de campo & boost de documento. Los valores de impulso están codificados en un solo byte. Entonces, la precisión puede perderse al almacenar este valor. La depuración con Searcher.Explain() le ayudaría a obtener la cantidad correcta de impulso.

Si desea conservar el valor de impulso (es útil, por ejemplo, cuando desea recrear el índice a partir del índice actual), puede agregarlo en un campo almacenado.

2

Lo importante que debe recordar acerca de impulsar no es abordarlo de forma aislada, debe considerarlo como parte de una estrategia global, hacer una lista de cada criterio utilizado para lograr la relevancia y luego ordenar esos criterios. Defina una relación entre cada uno de esos criterios. Si vuelve a indexar regularmente o acaba de agregar nuevos documentos, si vuelve a indexar regularmente, puede permitirse ajustar sus criterios de aumento de documentos, si no es necesario que lo analice minuciosamente de antemano.