2011-06-29 7 views
5

Acabo de acceder a la página de wiki de solr para clustering. Pero no estoy obteniendo el beneficio de usar la agrupación. ¿Puede alguien decirme qué es realmente clúster y cuál es su uso en la indexación y la búsqueda?qué es el componente de clúster de solr

por favor, responda

Respuesta

9

La agrupación es una técnica estadística para agrupar los datos en grupos a que pertenecen 'juntos'. En Solr específicamente, esto significa que intentará agrupar los resultados de una determinada consulta y etiquetar esos grupos.

Esto podría proporcionarle información adicional sobre la naturaleza de los resultados devueltos. Ejemplo: si busca 'Python' en un conjunto muy amplio de documentos, el componente de agrupación puede crear grupos para 'The Python programming language', 'Python the snake', etc.

Eche un vistazo a la Carrot2 sitio de demostración para una demostración: (carrot2 es el motor de la agrupación se envía con Solr)

http://search.carrot2.org/stable/search

componentes de la agrupación de Solr (carrot2) Clusters los documentos con los campos de texto que son devueltos por Solr en una lista de resultados. (Los campos utilizados son configurables). Utiliza los términos en el campo de texto para compilar los clústeres y etiquetarlos.

Hay una presentación muy interesante en el sitio web carrot2:

http://project.carrot2.org/publications/carrot2-dresden-2007.pdf

+3

Y 'Monty Python' por supuesto! – JanRavn

+0

sobre qué base agrupará los resultados. me refiero a cómo se etiquetan los resultados – Romi

+3

Los componentes de agrupación de Solr (Carrot2) agrupan los documentos utilizando los campos de texto que Solr devuelve en una lista de resultados. (Los campos utilizados son configurables). Utiliza los términos en el campo de texto para compilar los clústeres y etiquetarlos. Hay una presentación muy interesante en el sitio web Carrot2: http://project.carrot2.org/publications/carrot2-dresden-2007.pdf – JanRavn

Cuestiones relacionadas