2008-09-15 12 views
14

Lucene tiene un soporte bastante pobre para el idioma ruso.Analizador de idioma ruso en Lucene y Lucene.Net

RussianAnalyzer (parte de lucene-contrib) es de muy baja calidad.

El módulo RussianStemmer para Snowball es aún peor. No reconoce el texto ruso en cadenas Unicode, aparentemente suponiendo que alguna extraña combinación de Unicode y KOI8-R debe usarse en su lugar.

¿Conoces alguna solución mejor?

Respuesta

0

Esa es la belleza de código abierto. Usted tiene el código fuente, por lo que si las implementaciones actuales no le funcionan, siempre puede crear las suyas propias o incluso mejores, ampliar las existentes. Un buen comienzo sería el libro "Lucene in Action".

Cuestiones relacionadas