Necesito extraer objetos de tabla de documentos PDF de preferencia programáticamente usando Perl. Puedo cortar y pegar en Excel, pero la tabla requeriría bastante edición manual una vez que los datos se hayan importado a Excel.¿Puedo extraer tablas de PDF usando Perl?
He hecho algunas búsquedas, pero hasta ahora parece que la mayoría de los foros sugieren que la mayoría de las API son muy primitivas.
Me acabo de pasar medio día tratando de hacer exactamente esto. Mi conclusión fue que sería más rápido simplemente copiar y pegar en Excel que tratar de obtener datos de un archivo PDF mediante programación. – CanSpice
¿Has mirado en CPAN? Hay varias API altamente calificadas allí. También hay algunas opciones no gratuitas, como PDFlib, que se pueden usar desde Perl y funcionan muy bien. – Cfreak
@Cfreak, sí miré a CPAN; como se mencionó anteriormente, no parece que esos módulos puedan leer objetos en PDF. Si me equivoco, me encantaría que alguien señalara el módulo correcto y cómo usarlo para leer una tabla. – Face