Estaba evaluando agregar un corrector ortográfico a un producto que tengo. Según mi investigación, las principales decisiones que deben tomarse son:
Verificación ortográfica de código abierto
- La biblioteca a usar.
- Diccionario (esto puede ser específico de la región, inglés británico, americano, etc.).
- Listas de exclusión. Cada vez que se detecta un error tipográfico, es posible que no sea un error tipográfico, sino que es una verborrea específica del usuario. En este punto, los usuarios deben tener la capacidad de
agregar esto a su lista de exclusión personalizada. - Además de una lista personalizada por usuario, también una lista de exclusión basada en el espacio de usuario de los clientes de la herramienta. Eso es términos/acrónimos en el dominio de trabajo de los usuarios. Por ejemplo, FX no será un error tipográfico para los operadores de divisas.
Las preguntas abiertas que tenía se enumeran a continuación y si pudiera obtener una entrada en ellas sería muy útil. Para 1, estaba pensando en Hunspell, que es la biblioteca de código abierto ofrecida bajo MPL y es utilizada por Firefox y la familia de productos OpenOffice. ¿Alguna historia de terror usando esto? ¿Hay áreas grises con la licencia? La revisión ortográfica se realizará en un cliente de Windows.
Los diccionarios están disponibles en una variedad de fuentes, algunas gratuitas bajo MPL, mientras que otras no. Cualquier sugerencia sobre buenas fuentes de diccionarios gratuitos.
Soporte multilingüe y ¿qué se debe resolver para darles soporte?
Para 4, ¿cómo se mantienen sincronizados los diccionarios personalizados con el lado del servidor y el lado del cliente? El corrector ortográfico debe realizarse en el lado del cliente, de modo que ¿se presionan con el inicio inicial cada vez o se sincronizan con demasiada frecuencia?
¿Qué lenguaje de programación/plataforma está utilizando? –
ventanas no basadas en web. se enviará como una instalación de cliente. – HeretoLearn