2011-02-17 12 views
5

¿Alguien puede proporcionar un análisis comparativo simple de estos motores de búsqueda? ¿Qué ventajas tiene cualquiera de los frameworks?mg4j vs. apache lucene

Por cierto, he visto las siguientes explicaciones básicas de la elección mg4j de varios trabajos académicos:

  • combinando los índices sobre la misma colección
  • multi-índice de consulta

Actualización:

These slides (f rom mir2ed.org) contiene una visión más fresca de los motores de búsqueda de código abierto, incluyendo Lucene y mg4j en la evaluación comparativa varios aspectos: la memoria & CPU, el tamaño del índice, el rendimiento de búsqueda, la calidad de búsqueda, etc.

Respuesta

3

Jeff Dalton reviewed many open source search engines incluyendo Lucene y mg4j en 2007 y actualizó la comparación en 2009.

No he utilizado mg4j. Aunque he usado Lucene. La característica número uno de Lucene IMO es su amplia adopción y maravillosa comunidad de usuarios/desarrolladores/committers. Esto significa que hay muchas posibilidades de que alguien haya trabajado en un caso de uso similar al tuyo usando Lucene. Los puntos débiles actuales de Lucene son su modelo de puntuación y su capacidad de escalar a grandes colecciones de texto. Los desarrolladores de Lucene están trabajando en estos problemas.

Creo que la elección de una biblioteca de búsqueda depende en gran medida de su configuración (académica o industrial), las otras partes de su aplicación y su caso de uso.

+0

Gracias. ¿Qué pasa con [SOLR] (http://lucene.apache.org/solr/features.html)? ¿Resuelve estos problemas de Lucene? –

+0

Solr es un motor de búsqueda que agrega funcionalidad a Lucene. Agrega algunas capacidades de escalado a Lucene y es mucho más fácil comenzar a trabajar con él. Solr Cloud - http://wiki.apache.org/solr/SolrCloud es un esfuerzo para hacer que Solr sea mucho más robusto y escalable. La puntuación en Solr es idéntica a Lucene. –

+0

[elasticsearch] (https://www.elastic.co/) es otro motor de búsqueda construido sobre Lucene. – Bax