2009-07-03 19 views
10

Estaba evaluando agregar un corrector ortográfico a un producto que tengo. Según mi investigación, las principales decisiones que deben tomarse son:
Verificación ortográfica de código abierto

  1. La biblioteca a usar.
  2. Diccionario (esto puede ser específico de la región, inglés británico, americano, etc.).
  3. Listas de exclusión. Cada vez que se detecta un error tipográfico, es posible que no sea un error tipográfico, sino que es una verborrea específica del usuario. En este punto, los usuarios deben tener la capacidad de
    agregar esto a su lista de exclusión personalizada.
  4. Además de una lista personalizada por usuario, también una lista de exclusión basada en el espacio de usuario de los clientes de la herramienta. Eso es términos/acrónimos en el dominio de trabajo de los usuarios. Por ejemplo, FX no será un error tipográfico para los operadores de divisas.

Las preguntas abiertas que tenía se enumeran a continuación y si pudiera obtener una entrada en ellas sería muy útil. Para 1, estaba pensando en Hunspell, que es la biblioteca de código abierto ofrecida bajo MPL y es utilizada por Firefox y la familia de productos OpenOffice. ¿Alguna historia de terror usando esto? ¿Hay áreas grises con la licencia? La revisión ortográfica se realizará en un cliente de Windows.

Los diccionarios están disponibles en una variedad de fuentes, algunas gratuitas bajo MPL, mientras que otras no. Cualquier sugerencia sobre buenas fuentes de diccionarios gratuitos.

Soporte multilingüe y ¿qué se debe resolver para darles soporte?

Para 4, ¿cómo se mantienen sincronizados los diccionarios personalizados con el lado del servidor y el lado del cliente? El corrector ortográfico debe realizarse en el lado del cliente, de modo que ¿se presionan con el inicio inicial cada vez o se sincronizan con demasiada frecuencia?

+0

¿Qué lenguaje de programación/plataforma está utilizando? –

+0

ventanas no basadas en web. se enviará como una instalación de cliente. – HeretoLearn

Respuesta

2

He usado Hunspell para algunas cosas, y realmente no tengo ninguna historia de terror con ella. Solo lo he usado con inglés (americano), pero dice que funciona con otros idiomas.

En cuanto a la licencia, ofrece una opción de GPL, LGPL y MPL. Si no le gusta el MPL, siempre puede optar por utilizar el LGPL.

9

Como ya se ha mencionado Hunspell es un estado del corrector arte hechizo. Es el corrector ortográfico de Open Office, Thunderbird, Firefox y Google Chrome. Los puertos a todos los principales lenguajes de programación están disponibles. Funciona con los Open Office Directories, por lo que se admiten muchos idiomas.

0

He aquí una buena demostración de Peter Norvig: encuentro esta explicación simple mucho más intuitiva. Siga los enlaces en el documento también para un análisis más en profundidad.

http://norvig.com/spell-correct.html

Cuestiones relacionadas