Supongo que podría tomar un texto y eliminar las palabras en inglés de alta frecuencia. Por palabras clave, quiero decir que quiero extraer las palabras que más caracterizan el contenido del texto (etiquetas). No tiene que ser perfecto, una buena aproximación es perfecta para mis necesidades.¿Qué es una forma simple de generar palabras clave a partir de un texto?
¿Alguien ha hecho algo como eso? ¿Conoces una biblioteca de Perl o Python que hace eso?
Lingua :: EN :: Tagger es exactamente lo que pregunté, sin embargo, necesitaba una biblioteca que también funcionara en francés.
Lo ¿te refieres con "palabra clave"? – PEZ
No olvide que la mayoría de los sistemas simples pueden ser engañados. Wirth escribió el sistema operativo THE. Ahora intenta buscar en Google ...: D –