2009-06-23 8 views
5

He estado usando nutch por un tiempo, poco reciente que conozco sobre este complejo.Rendimiento y cuello de botella de Zend_Search_Lucene?

¿Cómo es su rendimiento y cuál es el límite de tamaño de archivo que puede admitir?

Además, ¿cómo eliminar o actualizar un índice en lugar de volver a indexar cada vez que hay una modificación?

Respuesta

8

Zend_Search_Lucene es una implementación pura de PHP del formato Apache Lucene. Las versiones de formato de índice Lucene compatibles actualmente (a partir de ZF 1.6) son 1.4 - 2.3. Para obtener más información sobre Lucene, visite http://lucene.apache.org/java/docs/.

En lo que respecta a los límites de tamaño de índice, el tamaño del índice está limitado por 2 GB para las plataformas de 32 bits, y hasta donde yo sé, no está limitado a las plataformas de 64 bits.

El rendimiento es en gran parte una variante en función de cómo construya sus índices. Asegúrese de verificar la sección del manual that deals with performance.

Además, Luke (una herramienta de diagnóstico para los índices de Lucene) es muy útil en la optimización del rendimiento y la resolución de problemas.

P.S. Con respecto a la actualización, el formato de archivo de índice Lucene no admite la actualización de documentos. Los documentos se deben eliminar y volver a agregar al índice para actualizarlos de manera efectiva. Esto es cierto para la implementación de Java también.

+0

Gracias por su comentario. Pero nutch puede fusionar índices nuevos y viejos en otro, ¿por qué Lucene? Nutch no se basa en Lucene. BTW, ¿son los archivos de índice generados por nutch directamente utilizables por Zend_Search_Lucene? – omg

+2

Puede fusionar índices con Lucene y Zend_Search_Lucene. También puede actualizar _indexes_, como agregar un campo, por ejemplo. PERO, no puede actualizar un documento EN UN índice. Creo que no entiendes lo que es Nutch. Nutch es un motor de búsqueda que utiliza Lucene para sus índices y búsquedas. Entonces sí, sus índices deberían ser compatibles. – jason

+0

Wow, entonces creo que ahora puedo hacer indexación incremental para Zend_Search_Lucene.Gracias. – omg

Cuestiones relacionadas