Estoy tratando con una aplicación que está aceptando la entrada del usuario en diferentes idiomas (actualmente 3 idiomas fijos). El requisito es que los usuarios puedan ingresar texto y no molestarse en seleccionar el idioma a través de la casilla provista en la interfaz de usuario.¿Cómo detectar el idioma del texto ingresado por el usuario?
¿Hay una biblioteca Java existente para detectar el idioma de un texto?
Quiero algo como esto:
text = "To be or not to be thats the question."
// returns ISO 639 Alpha-2 code
language = detect(text);
print(language);
resultado:
EN
no quiero saber cómo crear un detector de lenguaje por mí mismo (he visto un montón de blogs tratando de Haz eso). La biblioteca debe proporcionar un APi simple y también funcionar completamente fuera de línea. El código abierto o comercial cerrado no importa.
También encontraron esta preguntas sobre SO (y algunos más):
How to detect language
How to detect language of text?
favor, lea esto: http://stackoverflow.com/questions/1383503/how-to-determine-the-natural-language-of-a- documento –
@ S.Lott: gracias, ya leí mucho, solo busco una lib de trabajo que funcione sin conexión, no quiero crear nada por mi cuenta. – ManBugra
Reconocer de manera confiable el lenguaje natural se considera un problema difícil. Cualquier solución que se ajuste a su espacio de código y disco duro no es probable que sea muy buena. –