¿Puede sugerir alguna biblioteca ligera de búsqueda de texto difuso?Biblioteca ligera de búsqueda difusa
Lo que quiero hacer es permitir que los usuarios encuentren datos correctos para los términos de búsqueda con errores tipográficos.
Podría usar motores de búsqueda de texto completo como Lucene, pero creo que es una exageración.
Editar:
Para hacer más clara la pregunta aquí es un escenario principal para esa biblioteca:
tengo una gran lista de cadenas. Quiero poder buscar en esta lista (algo así como el intellisense de MSVS), pero debería ser posible filtrar esta lista por cadenas que no están presentes pero lo suficientemente cerca de alguna cadena que esté en la lista.
Ejemplo:
- Rojo
- verde
- azul
Cuando escribo 'Gren' o 'Geen' en un cuadro de texto, quiero ver 'verde' en el resultado conjunto.
El idioma principal de los datos indexados será el inglés.
Creo que Lucene es pesado para esa tarea.
actualización:
he encontrado un producto a juego mis requisitos. Es ShuffleText.
¿Conoces alguna alternativa?