¿Hay alguna biblioteca C# que pueda detectar el idioma de una determinada pieza de texto? es decir, para un texto de entrada "This is a sentence"
, debe detectar el idioma como "English"
. O para "Esto es una sentencia"
, debe detectar el idioma como "Spanish"
.Detectar lenguaje de texto
Entiendo que la detección del lenguaje desde el texto no es un problema determinista. Pero tanto Google Translate como Bing Translator tienen una opción de "detección automática", que mejor adivina el idioma de entrada. ¿Hay algo similar disponible públicamente, preferiblemente en C#?
El otro día vi una de mis páginas web de intranet en un PC con Google Traductor instalado. La página solo tiene algunas palabras como ** mean ** y ** stddev ** y algunos números. Google Translator me dijo que la página estaba en ** rumano ** y me preguntó si quería una traducción. Si no es un ** problema determinista **, ¿cómo puede el software hacer un buen trabajo? – pavium
A veces hacen un buen trabajo. Por supuesto, habrá insumos por los que fracasan por completo, pero para los insumos más probables que funcionan razonablemente bien –
http://stackoverflow.com/questions/1192768/return-the-language-of-a-given-string/1192802 # 1192802 –