Investigo cómo extraer imágenes de un archivo PDF grande (> 300MB). Estoy usando pdfbox, pero por alguna razón particular que no puedo entender, algunas páginas no se extraen correctamente.Cómo extraer imágenes del pdf usando Java (sin usar el pdfbox)
Estoy utilizando la clase PDFToImage de pdfbox como base para mi código.
Entonces, ¿conoce otra biblioteca que me pueda ayudar a hacer esto? Sé que se puede usar iText, pero he leído que no se puede usar para productos comerciales.
He instalado los paquetes xpdf y xpdf-utils, y la herramienta llamada pdfimages funciona perfectamente. Pero necesito resolver este problema desde Java y debería ser portátil.
Puede portar xpdf-utils a Java. – erjiang
iText está bajo GPL a menos que compre una licencia comercial. –
Probaré con las versiones <5, creo que el cambio en los términos de licencia se cambió para las versiones> = 5. –