Lucene tiene un soporte bastante pobre para el idioma ruso.Analizador de idioma ruso en Lucene y Lucene.Net
RussianAnalyzer (parte de lucene-contrib) es de muy baja calidad.
El módulo RussianStemmer para Snowball es aún peor. No reconoce el texto ruso en cadenas Unicode, aparentemente suponiendo que alguna extraña combinación de Unicode y KOI8-R debe usarse en su lugar.
¿Conoces alguna solución mejor?