Tengo problemas con un índice Lucene, que tiene palabras indexadas, que contienen caracteres "-".Lucene Problemas de índice con el carácter "-"
Funciona para algunas palabras que contienen "-" pero no para todas, y no encuentro el motivo, por qué no está funcionando.
El campo que estoy buscando, se analiza y contiene la versión de la palabra con y sin el carácter "-".
estoy usando el analizador: org.apache.lucene.analysis.standard.StandardAnalyzer
aquí un ejemplo:
si busco "gsx- *" Tengo resultado, el índice campo contiene "SUZUKI GSX-R 1000 GSX-R1000 GSXR"
pero si busco "v- *" no obtuve ningún resultado. El campo indexado del resultado esperado contiene: "SUZUKI DL 1000 V-Strom DL1000V-STROMVSTROM V STROM"
Si busco para "V-Strom" sin "*" funciona, pero si sólo la búsqueda de " v-str "por ejemplo, no obtengo el resultado. (Debe haber un resultado porque es para una búsqueda en vivo de una tienda web)
Entonces, ¿cuál es la diferencia entre los 2 resultados esperados? ¿Por qué funciona para "gsx- " pero no para "v-"?
Interesante, trabajo con Solr y manejo V-Strom 650 :) –
¿Ha comprobado realmente el contenido del campo indexado o solo espera que sea así? Si no utiliza la herramienta de índice más grande de Lucene, Luke: http://code.google.com/p/luke/ –
sí, se muestra el mismo campo que estoy buscando en – Zteve