Estoy buscando una biblioteca que pueda realizar un análisis morfológico en palabras alemanas, es decir, convierte cualquier palabra en su forma raíz y proporciona meta información sobre la palabra analizada.¿Existe una biblioteca gratuita para el análisis morfológico de la lengua alemana?
Por ejemplo:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
Mi lista de deseos:
- Tiene que funcionar con ambos nombres y verbos.
- Soy consciente de que esta es una tarea muy difícil dada la complejidad del idioma alemán, por lo que también estoy buscando libraries que proporcionen solo aproximaciones o que solo sean 80% precisas.
- Preferiría bibliotecas que no funcionan con diccionarios, pero de nuevo estoy abierto a un compromiso dadas las circunstancias.
- También preferiría las bibliotecas de C/C++/Delphi Windows, porque eso haría que fueran más fáciles de integrar pero .NET, Java, ... también funcionarán.
- Tiene que ser una biblioteca gratuita. (L) GPL, MPL, ...
EDIT: Soy consciente de que no hay manera de realizar un análisis morfológico y sin ningún diccionario en absoluto, debido a las palabras irregulares. Cuando digo, prefiero una biblioteca sin un diccionario esos diccionarios completo soplado, que se asignan a cada palabra que quiero decir:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
Esos diccionarios tienen varios inconvenientes, entre ellos el enorme tamaño y la incapacidad para procesar palabras desconocidas.
Por supuesto, todas las excepciones sólo pueden ser manejados con un diccionario:
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
(Mi mente está haciendo girar ahora :))
Usted es parte de razón, he actualizado mi pregunta. –