¿Eso es posible?Leyendo datos de archivos PDF en R
Tengo un montón de informes heredados que necesito importar a una base de datos. Sin embargo, están todos en formato pdf. ¿Hay algún paquete R
que pueda leer el pdf? ¿O debería dejar eso en una herramienta de línea de comando?
Los informes se hicieron en excel y luego en pdf, por lo que tienen estructura regular, pero muchas "celdas" en blanco.
Tomando una mirada a CRAN, hay no parece ser una biblioteca que hace eso. Tal vez sea mejor que use otro idioma que tenga tales bibliotecas (Perl y Python, por ejemplo, ambos las tienen), tome los datos que necesita y luego guárdelos en un archivo que pueda leer R. –
@JackManey Gracias , es lo que pensaba. Hay 'readPDF' en el paquete' tm' (minería de textos), pero no es exactamente fácil de usar y creo que usa la utilidad de línea de comando 'pdftotext' de todos modos. – Justin
Tienes mis condolencias. ¡Quizás algún día vivamos en un mundo donde todos los datos estén disponibles como datos! –