Bastante simple, necesito extraer texto de varios archivos PDF (bastante bastante) para analizar los contenidos antes de pegarlo en una base de datos SQL.Extraer texto de archivos PDF en C#
He encontrado algunas librerías de C# bastante escasas que funcionan (la mejor usa iTextSharp), pero hay muchos errores de formateo y algunos caracteres están codificados y muchas veces hay espacios ('') EN TODAS PARTES - Dentro de las palabras, entre cada letra, enormes bloques de ellos que ocupan varias líneas, todo parece un poco aleatorio.
¿Hay alguna manera fácil de hacer esto que estoy pasando por alto (bastante probable!) O es una tarea un poco ardua que implica la conversión de los valores de bytes extraídos en letras de manera confiable?
Saludos,
Duncan
Véase también http://stackoverflow.com/q/10982156/292060 – goodeye