Tengo que analizar archivos PDF, que se encuentran en HDFS en un programa Map Reduce en Hadoop. Entonces obtengo el archivo PDF de HDFS como Entradas de entrada y tiene que ser analizado y enviado a l
Estoy buscando una manera rápida y confiable para leer/analizar archivos PDF grandes en Ruby (en Linux y OSX). Hasta ahora he encontrado el más viejo y simple PDF-toolkit (un pdftotext -wrapper) y PDF
No puedo detectar la página en blanco en el archivo pdf. He buscado en Internet pero no he encontrado una buena solución. Uso de Itextsharp Probé con el tamaño de página, Xobjects. Pero no dan el resu
Necesito analizar un documento PDF. Ya implementé el analizador y usé la biblioteca iText y hasta ahora funcionó sin ningún problema. Pero no, necesito analizar otro documento que obtiene espacios en