¿Alguien puede recomendar un buen libro (s)/papel (s)/artículo (s) en la búsqueda de texto completo (y tal vez la indexación en general). Soy bastante anal sobre tener que entender qué está sucediendo entre bastidores en mis aplicaciones, y tengo problemas para entender por qué Sphinx y otros FTS externos dejan a MySQL/MyISAM en el polvo.Imprimación de búsqueda de texto completo?
Respuesta
Para entender la búsqueda de texto completo de abajo hacia arriba, recomiendo "Gestionar Gigabytes".
Comenzaría con this. Es para SQL Server, pero una lectura no va a doler, ya que muchos conceptos diferentes a los de implementación serán (muy probablemente) los mismos en los DB.
Encontré la página de búsqueda de texto completo de postgres http://www.postgresql.org/docs/8.3/static/textsearch.html muy esclarecedor.
Especialmente: http://www.postgresql.org/docs/8.3/static/textsearch-intro.html
operadores Pruebas de búsqueda en bases de datos han existido durante años. PostgreSQL tiene ~, ~ *, operadores similares, y ILIKE para tipos de datos textual, pero carecen de muchas de las propiedades esenciales requeridos por los modernos sistemas de información:
- no hay apoyo lingüístico, incluso de Inglés. Las expresiones regulares son no suficientes porque no pueden manejar fácilmente palabras derivadas, por ejemplo, satisface y satisface. Es posible que se pierda los documentos que contengan satisfies, , aunque es probable que desee encuéntrelos cuando busque satisfacer. Es posible utilizar O para buscar para múltiples formularios derivados, pero este es tedioso y propenso a errores (algunas palabras pueden tener varios miles de derivados ).
- No proporcionan ningún orden (clasificación) de resultados de búsqueda, lo que los hace ineficaz cuando se encuentran miles de documentos coincidentes.
- Tienden a ser lentos porque hay sin soporte de índice, por lo que deben procesar todos los documentos para cada búsqueda de .
Hay un excelente libro gratis Recuperación de Información (Christopher D. Manning, Prabhakar Raghavan y Hinrich Schütze, Introducción a la Recuperación de Información, Cambridge University Press. 2008), incluyendo la búsqueda de texto, disponible gratuitamente (legit) here.
“Una Arquitectura Orientada a Objetos de texto de recuperación”
- 1. RavenDB búsqueda de texto completo
- 2. Sunspot/Solr Búsqueda de texto completo: ¿cómo excluir ciertos campos de la búsqueda de texto completo?
- 3. Búsqueda de texto completo de SQL Server
- 4. Ranking de búsqueda de texto completo
- 5. mongodb estrategia de búsqueda de texto completo
- 6. ¿Microsoft Access tiene búsqueda de texto completo?
- 7. búsqueda de texto completo instalado o no
- 8. Búsqueda de texto completo como Google
- 9. Cassandra búsqueda de texto completo como
- 10. ¿Búsqueda de texto completo más rápido hoy?
- 11. Búsqueda de texto completo ignorando los comentarios
- 12. MySQL búsqueda de texto completo varias palabras
- 13. Django MySQL búsqueda de texto completo
- 14. Búsqueda de texto completo para Rails 3
- 15. búsqueda de texto completo en LINQ
- 16. Búsqueda de texto completo en SQL Azure
- 17. Búsqueda de texto completo: Whoosh Vs SOLR
- 18. Búsqueda de texto completo en CRM 2011
- 19. Búsqueda de texto completo de MySQL Confusión de modo booleano
- 20. Índices de búsqueda de texto completo de SQLite
- 21. MySQL Resultado de búsqueda de texto completo Explicación
- 22. Catálogo de texto completo/búsqueda de índice% libro%
- 23. Búsqueda de texto completo de MySQL en Ruby on Rails
- 24. ¿Cómo funciona la búsqueda de texto completo de MySQL?
- 25. Búsqueda de texto completo de PostgreSQL y MySQL
- 26. Django completo orden de búsqueda de texto por relevancia
- 27. búsqueda de texto completo de mysql no devolviendo registros
- 28. Búsqueda de subcadena de texto completo en iOS
- 29. Búsqueda de texto completo de MySQL en varias tablas
- 30. Ranking de búsqueda de texto completo (SQL Server)