2010-05-23 15 views
6
Zend Lucene

y Java Lucene se construyen en PHP y Java repectively, y el lenguaje PHP tiene un nivel superior al de Java.comparación de rendimiento entre Zend Lucene y Java Lucene

Sólo me preguntaba ¿Qué tan grande la diferencia de rendimiento entre estos dos, con respecto a la construcción y el índice de búsqueda de datos?

¿Es mucho más eficaz para dejar de Java crear y reconstruir el índice, y dejar que PHP utiliza el índice?

Respuesta

12

Esta es una cita de un Ingeniero Certificado Zend.

En contra de mi mejor juicio, la empresa donde trabajo emigraron nuestra anterior solución de búsqueda para Zend_Search_Lucene. En el hardware bastante pesado , la indexación de un millón de documentos tomaron varias horas, y las búsquedas fueron relativamente lento. El proceso de indexación consume grandes cantidades de la memoria, y los índices de frecuencia se corrompió (usando 1.5.2). Una búsqueda simple de comodín literalmente puso al servidor web de rodillas, , por lo que deshabilitamos esa función. El uso de la memoria era muy alto para las búsquedas, y como resultado las solicitudes por segundo necesariamente disminuyeron fuertemente ya que teníamos para reducir el número de procesos de Apache child.

Desde entonces nos hemos trasladado a Solr (un servidor de búsqueda Java basado en Lucene ) y la diferencia es dramática. La indexación de ahora demora alrededor de 10 minutos y las búsquedas de son muy rápidas. Qué diferencia hace un lenguaje.

Original Article

En este caso, Java.

+0

Ditto Inkspeak también. –

+1

Gracias. Creo que todavía me apegaría a Zend_Search_Lucene al principio para un desarrollo práctico con Zend framework. Luego paso a soluciones avanzadas una vez que el rendimiento es inaceptable. Además, Zend Lucene es compatible con el índice creado por java Lucene. Así que puedo hacer un cambio fácilmente a la indexación de JAVA Lucene en el futuro – Capitaine

+2

Aquí hay un consejo: cuando desarrolle sus llamadas de búsqueda abstractas para que pueda agregar fácilmente cualquier motor de búsqueda que elija usar. Esto le ahorrará tiempo si alguna vez necesita volver a diseñar su código para una fuente de datos diferente. –

2

Cuando hice esta pregunta de un Zend Evangelista y uno de sus asesinos a sueldo, me dijeron que el Java Lucene proporcionaría sustancialmente mejor rendimiento. Sus puntos principales se refieren al manejo de los caracteres UTF8 y la velocidad de indexación (si no recuerdo mal). Aparentemente Java Lucene es mucho mejor en esto.

Does Zend Lucene need Java Lucene?