Estaba a punto de integrar la búsqueda basada en Sphinx en el sitio web, pero descubrí que no hay soporte integrado para la corrección ortográfica.Corrección ortográfica en Sphinx?
La gente en la web sugiere usar pspell u otras bibliotecas de terceros para hacer las cosas, pero el problema es que los datos que voy a buscar contienen términos "técnicos" como marcas, por lo tanto no lo hago t pensar que las bibliotecas comunes los incluirán.
Por otro lado, Xapian dice que tiene soporte de corrección ortográfica basado en los datos indexados, por lo que es exactamente lo que quiero. ¿Vale la pena usar Xapian en su lugar? Todavía estoy bastante confundido de qué motor de búsqueda de texto completo debería usar: Sphinx parece ser bastante bueno, pero le faltan algunas características interesantes de Xapian (¿o tal vez Lucene?), Mientras que parece que este último tiene una comunidad más pequeña y menos documentación.
Creo que puedo resolver el problema con palabras no presentes en el diccionario de pspell utilizando el personalizado para ello, pero no estoy seguro de si eso supondrá una pérdida notable de rendimiento. Voy a utilizar el sistema de búsqueda para la búsqueda de Spotlight (búsqueda por separado a través de ajax en cada letra ingresada) en un sitio web bastante popular, por lo que el rendimiento importa.
Idealmente, me gustaría hacer algunos campos como las marcas tienen más prioridad sobre el diccionario común, pero supongo que eso no es realmente importante ya que la mayoría de las marcas son bastante distintas de las otras palabras.
También son bienvenidas todas las sugerencias sobre el diseño general del motor de búsqueda de texto personalizado.
Gracias
¿Consideró cambiar a Apache Solr? Es una plataforma de búsqueda construida sobre Lucene: http://lucene.apache.org/solr/features.html#Detailed+Features – nuqqsa