Quiero saber si hay una API para hacer análisis de texto en Java. Algo que puede extraer todas las palabras en un texto, separar palabras, expresiones, etc. Algo que puede informar si se encuentra una palabra es un número, fecha, año, nombre, moneda, etc.¿Hay API para análisis/minería de textos en Java?
Estoy comenzando el análisis de texto ahora, entonces solo necesito una API para comenzar. Hice un rastreador web, ahora necesito algo para analizar los datos descargados. Se necesitan métodos para contar la cantidad de palabras en una página, palabras similares, tipo de datos y otros recursos relacionados con el texto.
¿Hay API para el análisis de texto en Java?
EDITAR: minería de texto, quiero extraer el texto. Una API para Java que proporciona esto.
Hubo algunas buenas respuestas en este hilo http://stackoverflow.com/questions/3778388/java-text-analysis-libraries – crowne
Quiero extraer información de películas de páginas descargadas. Cosas como título, actores, año, director, etc. –
@Renato Dinhani Conceição ¿Todas sus páginas descargadas tienen una estructura html común? (¿páginas web con plantilla?) – stemm