Estoy utilizando una base de datos MySQL y he estado utilizando la búsqueda basada en bases de datos. ¿Alguna ventaja y desventaja de los motores de base de datos y del motor de búsqueda Lucene? Me gustaría recibir sugerencias sobre cuándo y dónde usarlos.Motor de búsqueda Lucene vs Base de datos de búsqueda
Respuesta
Sugiero que lea Full Text Search Engines vs. DBMS. Un line-line sería: si la mayor parte de su caso de uso es la búsqueda de texto completo, use Lucene. Si la mayor parte de su caso de uso es uniones y otras operaciones relacionales, use una base de datos. Puede usar una solución híbrida para un caso de uso más complicado.
La búsqueda de Lucene tiene la ventaja de la indexación. La publicación This puede ayudarlo a comprender lucene.
creo que también podemos agregar un índice en la tabla de la base de datos. pero no tengo ni idea de qué es? –
Uso Lucene cuando se desea índice textual Documentos (de cualquier longitud) y la búsqueda de texto dentro de esos documentos, devolviendo una lista clasificada de documentos que coinciden con la consulta de búsqueda. El ejemplo clásico son los motores de búsqueda, como Google, que usan indexadores de texto como Lucene para indexar y consultar el contenido de las páginas web.
Las ventajas de utilizar Lucene sobre una base de datos como MySQL, para la indexación y búsqueda de texto son:
- para el desarrollador - herramientas para analizar, analizar y la información del índice textual (por ejemplo, derivados, plurales, sinónimos, tokenización) en múltiples idiomas. Lucene también se adapta muy bien para la búsqueda de texto.
- para el usuario - resultados de búsqueda de calidad. Lucene usa una muy buena similarity function (para comparar la consulta de búsqueda con cada documento), en el centro de la cual se encuentran la frecuencia de similitud cosenoidal y la de término/documento inverso. Esto da como resultado buenos resultados de búsqueda con muy pocos ajustes necesarios por adelantado.
Muchos de useful info on Lucene here.
hay alguna alternativa más ventajosa a Lucene. Opensource or owner (Paid or REST API) –
Utilizamos Sql Server en el trabajo para realizar algunas consultas que utilizaban la búsqueda de texto completo. En el caso de grandes cantidades de datos, Sql realiza una combinación interna entre el conjunto de resultados devuelto por FullText y el resto de la consulta, que puede ser lenta si la base de datos se ejecuta en la máquina de baja potencia (2 GB de RAM para 20 GB de datos). Cambiar la misma consulta a Lucene mejoró considerablemente la velocidad.
- 1. Motor de búsqueda - Lucene o Solr
- 2. Búsqueda de resultados de búsqueda de Lucene
- 3. Búsqueda de multifield en Lucene
- 4. Motor de búsqueda para .net
- 5. Motor de búsqueda ASP.NET
- 6. Lucene Búsqueda de caracteres japoneses
- 7. Creación de un motor de búsqueda web
- 8. Paquete de motor de búsqueda instalable para búsqueda de archivos
- 9. programador amigable motor de búsqueda?
- 10. Motor de búsqueda en Java?
- 11. Fecha de indexación y búsqueda en Lucene
- 12. Complejidad de la búsqueda de un Lucene
- 13. motor de búsqueda con 'Quiso decir'
- 14. búsqueda binaria vs árbol de búsqueda binaria
- 15. motor de búsqueda de Google y paginación
- 16. Lucene búsqueda y guiones bajos
- 17. búsqueda aproximada en una base de datos
- 18. Búsqueda de frase exacta con Lucene?
- 19. Base de datos masiva con búsqueda de texto completo - Sphinx, Lucene, Cassandra, MongoDB, CouchDB
- 20. motor de búsqueda de expresiones regulares
- 21. . Motor de búsqueda de código abierto basado en .Net
- 22. Opciones de búsqueda de texto completo alojado - IndexTank vs Solr vs Lucene
- 23. ¿Cómo diseñar un motor de búsqueda personalizado?
- 24. motor de búsqueda Palabras clave Analizador
- 25. motor de búsqueda liviano para asp.net
- 26. Zend Lucene búsqueda y caracteres acentuados
- 27. php mysql búsqueda de texto completo: lucene, sphinx, o?
- 28. ¿Cómo creamos un motor de búsqueda simple usando Lucene, Solr o Nutch?
- 29. Base de datos de búsqueda de palabras ofensivas
- 30. Búsqueda de comodines en la base de datos de cassandra
He visto "buscar en nuestro sitio" en muchos sitios. Si voy a buscar el contenido de los sitios, ¿cuál sería mejor? –
La búsqueda en un sitio es búsqueda de texto completo. Por lo tanto, Lucene es mejor. Mejor aún, use Solr: http://lucene.apache.org/solr/ –
@YuvalF si la base de datos no es grande y el usuario de ese sitio no es tantos, ¿basta con la consulta de texto completo basada en DBMS? ya que a veces, si ese tipo quiere usar lucene, debe desarrollarlo solo ... – hugemeow