2009-05-05 13 views
6

podría sugerir en los pasos a seguir para el rendimiento de lucene. especialmente con datos grandes (alrededor de 1TB de archivos pdf para ser indexados)Lucene rendimiento

Respuesta

8
  1. Lea Scaling Lucene and Solr.
  2. Defina sus necesidades de Lucene (por ejemplo: está indexando archivos PDF; ¿necesita almacenar el texto completo, solo para que se pueda buscar, o no utilizar?)
  3. Haga un experimento a pequeña escala; indexe un pocos documentos, vea si la recuperación es lo suficientemente buena.
  4. Intente indexar todo (teniendo en cuenta los consejos del papel para una indexación rápida y para la indexación de la velocidad de recuperación) - ¿Es la recuperación lo suficientemente buena? ¿El rendimiento es lo suficientemente bueno?
  5. Iterar.
+0

hola gracias por la respuesta. ¿Qué tan difícil es convertir la implementación de lucene en implementación de solr? –

+1

Nunca lo intenté. Por lo que estoy escuchando, es muy fácil comenzar a usar Solr. Tal vez deberías probar Solr en pequeña escala. Tal vez debería tomar mi propio consejo ... –