text-extraction

53El calor

4Respuesta

Cómo extraer frases comunes/significativas de una serie de entradas de texto

Tengo una serie de elementos de texto: HTML sin procesar de una base de datos MySQL. Quiero encontrar las frases más comunes en estas entradas (no la frase más común, y lo ideal es que no se haga coin

17El calor

8Respuesta

Extracción de texto de HTML Java

Estoy trabajando en un programa que descarga páginas HTML y luego selecciona parte de la información y la escribe en otro archivo. Quiero extraer la información que está entre las etiquetas de párrafo

5El calor

4Respuesta

Conversión de PDF en texto viable usando C#

¿Hay una biblioteca que tenga una clase para extraer el texto de un archivo pdf en C# .net? He intentado algunos pero la documentación es terrible, así que no he podido despegar. También si proporcion