Tengo una lista de artículos, y cada artículo tiene su propio título y descripción. Desafortunadamente, de las fuentes que estoy usando, no hay forma de saber en qué idioma están escritos.¿Reconoce el lenguaje de un texto breve?
Además, el texto no está escrito enteramente en 1 idioma; casi siempre las palabras en inglés están presentes.
Creo que necesitaría bases de datos de diccionario almacenadas en mi máquina, pero me parece un poco impráctico. ¿Qué sugieres que haga?
Duplicado: http://stackoverflow.com/questions/1167262/automatically-determine-the-natural-language-of-a-website-page-given-its-url –
También la respuesta a esto puede hacer que esta pregunta innecesario, pero no - técnicamente - un duplicado. http://stackoverflow.com/questions/88984/your-favorite-natural-language-parser –
@Lott gracias:) – RadiantHex