2009-07-13 33 views
10

No estoy hablando de las cosas que comen los adictos a la salud, sino del software de búsqueda/indexación de código abierto basado en Xapian.¿Alguien ha probado el lino?

Actualmente, mi empresa emplea a alguien para implementarlo, y ellos quieren que use su funcionalidad en un proyecto en el que estoy trabajando, sin embargo, he oído poco al respecto y estoy un poco receloso de establecer un enlace a mi de lo contrario, código base sólido generalmente probado y probado.

¿Existen problemas conocidos con la implementación del lino que puedan causar problemas en otras áreas de mi compilación? Por ejemplo, es difícil sincronizar con la solución de base de datos estándar que ya está en uso, o los datos que envía vienen en un formato inestable o inflado (XML para un ejemplo de hinchazón [en este caso, fanboys XML])

Cheers, Ed

+1

Nunca he oído hablar de él, ¿es este motor de búsqueda empresarial? -> http://www.flax.co.uk/index.shtml – hannson

+0

@Hannson Yup, ese es el –

+0

@Ed: supongo que no estás muy interesado en los comentarios sobre Xapian. –

Respuesta

11

debería decir por adelantado que soy uno de los desarrolladores de lino, y uno de los dos originales desarrolladores de Xapian. ¡Espero poder seguir siendo informativo, a pesar de mi parcialidad!

lino es en realidad el nombre para un grupo de software relacionado:

  • "Xappy" es una biblioteca de pitón, que envuelve la interfaz Xapian estándar, y proporciona varias mayor características de nivel en la parte superior de (por ejemplo, esquemas,). Xappy todavía está en desarrollo, pero también se está implementando en varios sistemas de producción. Si planea usarlo en producción en esta etapa, le recomiendo que se ponga en contacto con los desarrolladores (por ejemplo, ¡yo!) Para delinear lo que está haciendo, para poder advertirle sobre posibles problemas, pero no lo haría. esperar algún problema importante.

  • "Flax basic" es una aplicación de búsqueda independiente. Como su nombre lo indica, esta es una pieza de software muy básica, y no esperamos que cubra las necesidades de la mayoría de las personas. Es en muchos sentidos solo una demostración de algunas de las posibilidades de Xapian; aunque es una demostración funcional, y algunas personas lo están usando para ejecutar sitios simples de búsqueda. Simplemente le permite indexar colecciones de archivos que están almacenados en un disco local (o unidades accesibles en red) y proporciona una interfaz web simple para buscarlas. Puede manejar una cantidad razonable de tipos de archivos en Windows (utilizando la interfaz ifilter), pero solo actualmente HTML y texto sin formato en otras plataformas. Viene con un instalador de Windows, pero es un poco más incómodo de instalar y ejecutar en Linux u otras plataformas. Creo que lanzamos la versión 1.0 de Flax básico hace aproximadamente un año, y aunque estamos haciendo actualizaciones ocasionales, no esperamos hacer ningún otro desarrollo significativo de la misma.

  • "El servidor de búsqueda de lino" es un servicio web construido sobre Xapian y Xappy, pensado para proporcionar una manera muy flexible de realizar indexación y búsqueda. Utiliza una API REST limpia y bien definida, utilizando JSON como transporte para los datos, y también hay clientes disponibles para PHP, Python y Perl que hacen que sea muy fácil hablar con la API. Escribir clientes para otros idiomas debe ser bastante directo. Si está integrando material de lino con un sistema más grande, este sería, teóricamente, el camino a seguir: el diseño permite una separación muy clara entre el sistema y el resto de un sistema.

Sin embargo, el gran inconveniente es que el servidor de búsqueda de Flax aún no se ha completado. Hay algunos archivos alpha tarball disponibles, pero recomiendo obtener la última fuente de SVN si quieres probarlo.Nuestro plan actual es tener una versión formal del servidor completo dentro de un par de meses: una gran parte de lo que falta actualmente es documentación y ejemplos, pero también hay un par de características pequeñas que se agregarán, algunos problemas que deben abordarse, y muchas pruebas para ser realizadas.

Los problemas en el proyecto del código de google en http://code.google.com/p/flaxcode/issues/list se dirigen principalmente (si no exclusivamente) a Flax basic. Hasta el momento, el servidor de búsqueda de Flax aún no se ha lanzado, y los problemas se encuentran en la forma de una lista de Todo, en lugar de en un rastreador.

Si está interesado en usar el servidor de búsqueda de Flax, entonces, de nuevo, le recomiendo ponerse en contacto conmigo ([email protected], o irc.freenode.net channel #flax), haciéndome saber qué en realidad, quiere hacerlo, y puedo decirle si tiene las características que está buscando y si esas características particulares son estables. Dado que el servidor de búsqueda de Flax se encuentra en una etapa tan temprana, no esperaría que haya muchos comentarios al respecto aún, pero si observa el diseño, valoraría mucho sus comentarios, ya que aún no estamos congelados y cualquier defecto de diseño puede abordarse fácilmente en esta etapa.

+0

Hola Richard, encontré tu respuesta en busca de un motor de búsqueda corporativo para una pequeña empresa, donde almacenamos nuestros archivos y datos en unidades de red. Supongo que Flax Basic podría ser una opción para nosotros. ¿Sigues con el proyecto Flax y tienes alguna actualización sobre otras herramientas recomendadas? Encontré esta publicación de blog reciente sobre el lino básico: http://www.flax.co.uk/blog/2015/03/19/free-file-filters-search-taxonomy-tools-from-our-old- googlecode-repository / – Trygve

Cuestiones relacionadas