2011-07-17 20 views
8

Soy un codificador newb en una startup y estoy implementando la búsqueda de documentos en un directorio en un host web.Entre Lucene/Solr, Whoosh, Sphinx, Xapian que se integra mejor con python?

Estoy comparando Lucene/Solr, Whoosh, Sphinx y Xapian. Whoosh es nativamente pitón. Pero también quiero tus opiniones sobre eso. ¿Cuáles de estos tienen

  • maduros y fáciles de usar e instalar interfaces con python? (Whoosh es una obviedad)
  • ninguna posibilidad de accidentes, obstáculos y otros fallos
  • interfaz mejor documentado (no estoy leyendo documentos PHP debido documentación de Python eran escasos)
  • más fácil de ponerse en marcha (sólo uno tiene un tutorial de inicio rápido)

Respuesta

2

Hablando en nombre de Apache Solr, Python tiene several Solr clients, que he recopilado en base a los comentarios de nuestros clientes en Websolr:

  1. es muy popular, y diseñado para una integración perfecta dentro de aplicaciones de Django. Si estás desarrollando una aplicación Django, Haystack es para ti.
  2. Sunburnt parece ser más genérico que Haystack, y también está muy bien documentado. Si lo estás haciendo muy bien con Python, vale la pena echarle un vistazo a Sunburnt.

Otros clientes Python Solr que he encontrado, que parecen un nivel más bajo de bits ...

Algunos detalles más sobre cómo se compila su aplicación (en particular, ¿es una aplicación Django?) Ayudaría a hacer cosas más simples wn desde aquí. ¡Buena suerte para encontrar la mejor opción para tu aplicación!

+0

Decidí hacerlo de forma genérica XML/HTTP. No es una aplicación de DJango. Es una tarea de back-end que hubiera sido demasiado tediosa en PHP. – aitchnyu

2

Utilice Whoosh si no necesita la velocidad, características adicionales de las alternativas. Es genial, tiene una buena API, buena documentación. Mi segunda opción probablemente sea Xapian, que es rápida y tiene una API bastante decente. Todos son productos bastante maduros. Si no sabes lo que realmente necesitas, simplemente iría con Whoosh por ahora.

2

Si desea una integración rápida de python, intente indextank. Puede estar en funcionamiento en 2 minutos, y es gratis.

Para las otras alternativas, me gustaría ir con Solr (siempre que se desea alojar los servidores de búsqueda usted mismo, o registrarse para websolr)

responsabilidad: Trabajo en indextank.

+0

IndexTank ahora es de código abierto: http://engineering.linkedin.com/open-source/indextank-now-open-source – javanna

Cuestiones relacionadas