Estoy trabajando en un proyecto para el cual quiero construir una nube de etiquetas leyendo un índice de Lucene y recortándolo. No configuré el motor Lucene, era alguien más en el equipo, ahora solo quiero leer su índice. ¿Cómo hacer eso en Java?¿Cómo leer un índice de Lucene?
Respuesta
lo que hay que buscar es cómo utilizar IndexReader clase, los .Términos() método devolverle todos los términos en el índice.
No está seguro de lo que entendemos por "leer" un índice:
Si desea consultar se puede utilizar IndexSearcher clase.
IndexReader le permite abrir el índice en modo de lectura.
Si desea ver el contenido del índice, puede utilizar Luke
Gracias! ¡Luke parece ser la solución que estaba buscando! Por cierto –
puede inicializar un 'IndexSearch' así: ' IndexSearcher IndexSearcher = new IndexSearcher (DirectoryReader.open (FSDirectory.open (nuevo archivo (pathToIndex)))); '' IndexSearcher' también tiene un constructor que acepta un 'ExecutorService', debe buscar eso para buscar diferentes segmentos en paralelo. –
Usted lo hace así -
IndexReader r = IndexReader.open("prdb_index");
int num = r.numDocs();
for (int i = 0; i < num; i++)
{
if (! r.isDeleted(i))
{
Document d = r.document(i);
System.out.println("d=" +d);
}
}
r.close();
a hacer esto:
File indexDirectory = new File("YourIndexLocation");
IndexReader reader = IndexReader.open(FSDirectory.open(indexDirectory));
return reader.maxDoc(); //return total docs in index
¡Gracias, finalmente un código! – nilsi
- 1. ¿Cómo asegurar/encriptar un índice Lucene?
- 2. actualización del índice lucene
- 3. Fusionar índice en Lucene
- 4. ¿Cómo lucene el índice de documentos?
- 5. ¿Cómo reparar el índice lucene dañado?
- 6. Encontrar el número de documentos en un índice Lucene
- 7. Lucene Problemas de índice con el carácter "-"
- 8. Almacenamiento de palabras con un apóstrofo en el índice Lucene
- 9. C# Lucene obtener todos los índice
- 10. ¿Índice múltiple o único en Lucene?
- 11. Cómo funciona Lucene
- 12. Lucene: ¿es la respuesta correcta para un gran índice?
- 13. ¿Cómo obtener todos los documentos del índice lucene?
- 14. Índice de Lucene con campos múltiples de la misma naturaleza
- 15. ¿Cómo borro/actualizo un documento con lucene?
- 16. Aumento de los términos de Lucene al compilar el índice
- 17. ¿es obligatorio optimizar el índice de lucene después de escribir?
- 18. Obtenga los términos de frecuencia más altos del índice Lucene
- 19. Cómo manejar las actualizaciones muy frecuentes a un índice de Lucene
- 20. Almacenar archivo de índice Lucene en una ubicación remota
- 21. comparación de rendimiento entre Zend Lucene y Java Lucene
- 22. ¿Cómo puedo obtener DocId cuando agrego un documento en el índice Lucene?
- 23. mahout lucene documento agrupando cómo?
- 24. ¿Cómo se consulta un índice ravendb que contiene fechas usando Lucene?
- 25. Cómo buscar caracteres especiales (+! \?:) En Lucene
- 26. Lucene - buscando un campo de valor numérico
- 27. ¿Cómo mejorar el rendimiento de Lucene en un entorno distribuido?
- 28. ¿Debería optimizarse un índice después de los índices incrementales en Lucene?
- 29. ¿Puede un índice de Lucene sin procesar ser cargado por Solr?
- 30. ¿Cómo estructurar un índice para escribir con anticipación para un conjunto de datos extremadamente grande usando Lucene o similar?
¡Esto se ve aún mejor! ¿Hay alguna posibilidad de que sepa cómo acceder al índice si está en la carpeta WEB-INF/index? Yo uso OpenCMS y esa es la ubicación predeterminada. –
de los documentos API. Las subclases concretas de IndexReader generalmente se construyen con una llamada a uno de los métodos static open(), p. abrir (Cadena). –