necesito para acceder a un índice de Lucene (creada mediante el rastreo de varias páginas web usando Nutch) pero está dando el error mostrado arribano hay segmentos * archivo encontrado
java.io.FileNotFoundException: no segments* file found in [email protected]/home/<path>: files:
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:516)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:185)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:148)
at DictionaryGenerator.generateDict(DictionaryGenerator.java:24)
at DictionaryGenerator.main(DictionaryGenerator.java:56)
busqué en Google, pero las razones dadas no fueron igualando el requisitos. El hecho de que los archivos se muestren (la ruta) probablemente significa que el directorio no está vacío.
Gracias
Hice todos ellos, excepto las versiones de Nutch y Lucene. No sabía que tenía que haber compatibilidad entre Lucene y Nutch. Si ayuda, la versión de lucene es 2.2. Puedo acceder a los archivos. De hecho, estoy ejecutando el programa Java en el mismo directorio que el índice. Además, revisé el índice usando Luke y definitivamente está bien. Además, la cuestión es que acabo de formar parte del proyecto. El índice es el resultado de un rastreo extenso realizado por Nutch. Entonces, no tengo ningún código de indexación. Fue solo un avance lento, pero aún así intentaré encontrar la imagen exacta. – crazyaboutliv
Una cosa que he observado es que la versión más nueva de Nutch (1.1) genera 5 carpetas después de un rastreo, mientras que los datos que tengo solo tienen 4 (de los cuales los segmentos son uno) carpetas. ¿Puede ser eso un problema? – crazyaboutliv
Como dijo Yuval, asegúrese de que el programa Java que usa para leer el índice usa la misma versión de Lucene que utilizó Nutch para crear el índice. –