Necesito una biblioteca Java para convertir archivos PDF a imágenes TIFF. Los archivos PDF son faxes y me convertiré en TIFF para poder hacer el reconocimiento de código de barras en la imagen. ¿Alguien puede recomendar una buena biblioteca de código abierto para la conversión de PDF a TIFF?¿Una buena biblioteca para convertir PDF a TIFF?
Respuesta
responsabilidad: yo trabajo para Atalasoft
We have an SDK that can convert PDF to TIFF. El renderizado funciona con el software Foxit, que hace un procesador de PDF muy poderoso y eficiente.
No puedo recomendar ninguna biblioteca de códigos, pero es fácil de usar GhostScript para convertir PDF en formatos de mapa de bits. Personalmente, he utilizado el siguiente script (que también utiliza las utilidades de netpbm) para convertir la primera página de un PDF en una miniatura JPEG:
#!/bin/sh
/opt/local/bin/gs -q -dLastPage=1 -dNOPAUSE -dBATCH -dSAFER -r300 \
-sDEVICE=pnmraw -sOutputFile=- $* |
pnmcrop |
pnmscale -width 240 |
cjpeg
Puede utilizar -sDEVICE=tiff...
para obtener una salida TIFF directa en varios TIFF sub-formatos de GhostScript.
He usado una solución de Ghostscript anteriormente, pero es simplemente demasiado lenta para el volumen que necesito manejar. – RedFilter
Quizás no sea necesario convertir el PDF a TIFF. Es muy probable que el fax sea una imagen incrustada en el PDF, por lo que podría extraer estas imágenes nuevamente. Eso debería ser posible con la biblioteca iText ya mencionada.
No sé si esto es más fácil que el otro enfoque.
No Itext no puede convertir archivos PDF a Tiff.
Sin embargo, hay bibliotecas comerciales que pueden hacer eso. jPDFImages es una biblioteca 100% java que puede convertir archivos PDF a imágenes en formatos TIFF, JPEG o PNG (¿y quizás JBIG? No estoy seguro). También puede hacer lo contrario, crear PDF a partir de imágenes. Comienza en $ 300 por un servidor.
Tome un vistazo a Apache PDFBox - A Java PDF Library
que aquí también haciendo la conversión de PDF -> G3 TIFF con resolución de alta y baja. Desde mi experiencia, la mejor herramienta que puede tener es Adobe PDF SDK, el único problema es su precio insensato. Entonces no lo usamos
lo que funciona bien para nosotros es ghostscript, las últimas versiones son bastante robustas y representan correctamente la mayoría de los pdfs. Y tenemos bastantes de ellos durante el día. En producción, la conversión se realiza utilizando gsdll32.dll; pero si quieres probar que utilice la siguiente línea de comandos:
gswin32c -dNOPAUSE -dBATCH -dMaxStripSize=8192 -sDEVICE=tiffg3 -r204x196 -dDITHERPPI=200 -sOutputFile=test.tif prefix.ps test.pdf
sería convertir el PDF en el alto res G3 TIFF. y el código prefix.ps está aquí:
<< currentpagedevice /InputAttributes get
0 1 2 index length 1 sub {1 index exch undef } for
/InputAttributes exch dup 0 <</PageSize [0 0 612 1728]>> put
/Policies << /PageSize 3 >> >> setpagedevice
otra cosa sobre este SDK es que es de código abierto; obtienes el código fuente de c y ps (postscript) para él. Además, si vas con otra herramienta, comprueba qué tipo de motor tienen para alimentar el procesamiento de PDF, podría suceder que estén usando gs para ello; como por ejemplo, LeadTools sí.
esperanza que esta ayuda, que se refiere a
tengo una gran experiencia con iText (ahora, estoy usando 5.0.6 versión) y este es el código de conversión TIFF a PDF:
private static String convertTiff2Pdf(String tiff) {
// target path PDF
String pdf = null;
try {
pdf = tiff.substring(0, tiff.lastIndexOf('.') + 1) + "pdf";
// New document A4 standard (LETTER)
Document document = new Document(PageSize.LETTER, 0, 0, 0, 0);
PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(pdf));
int pages = 0;
document.open();
PdfContentByte cb = writer.getDirectContent();
RandomAccessFileOrArray ra = null;
int comps = 0;
ra = new RandomAccessFileOrArray(tiff);
comps = TiffImage.getNumberOfPages(ra);
// Convertion statement
for (int c = 0; c < comps; ++c) {
Image img = TiffImage.getTiffImage(ra, c + 1);
if (img != null) {
System.out.println("page " + (c + 1));
img.scalePercent(7200f/img.getDpiX(), 7200f/img.getDpiY());
document.setPageSize(new Rectangle(img.getScaledWidth(), img.getScaledHeight()));
img.setAbsolutePosition(0, 0);
cb.addImage(img);
document.newPage();
++pages;
}
}
ra.close();
document.close();
} catch (Exception e) {
logger.error("Convert fail");
logger.debug("", e);
pdf = null;
}
logger.debug("[" + tiff + "] -> [" + pdf + "] OK");
return pdf;
}
Aquí es un buen artículo y clases contenedoras para usar GhostScript con C# .NET ... terminó usando esto en la producción
http://www.codeproject.com/KB/cs/GhostScriptUseWithCSharp.aspx
Puede usar la biblioteca icepdf (Apache 2.0 License). Incluso proporcionan este caso de uso exacto como uno de sus código fuente de ejemplo: http://wiki.icesoft.org/display/PDF/Multi-page+Tiff+Capture
- 1. Buena biblioteca de Tiff para .NET
- 2. Java API para convertir JPEG a TIFF
- 3. Biblioteca gratuita de PDF a TIFF en Windows?
- 4. La mejor manera de convertir archivos pdf a archivos tiff
- 5. buena biblioteca de PDF gratuita para Delphi
- 6. convertir tiff a formato jpg
- 7. Conversión de PDF a TIFF o texto en C#
- 8. Convertir HTML a PDF - Cualquier biblioteca para ASP.net
- 9. Herramientas para convertir PDF de varias páginas a multiples páginas TIFF
- 10. ¿Dónde puedo encontrar una buena biblioteca .NET PDF?
- 11. ¿Cuál es una buena opción para convertir documentos de Office a PDF o Imagen
- 12. convertir HTML a PDF
- 13. Biblioteca de PDF para Java
- 14. Convertir PDF a HTML
- 15. ¿Convertir una biblioteca estática a una biblioteca compartida?
- 16. Convertir PDF a HTML
- 17. ¿Qué biblioteca C++ puedo usar para convertir un PDF a una imagen en Windows?
- 18. Bash convertir a pdf
- 19. Buena biblioteca similar a STL para C
- 20. Usando iText para convertir HTML a PDF
- 21. convertir a pdf base64Binary
- 22. convertir pdf a svg
- 23. ¿Existe una buena biblioteca para acceder a HBase desde Python?
- 24. ¿Hay una buena biblioteca yaml para Android?
- 25. Una buena biblioteca de C++ para SOAP
- 26. Usando Ghostscript para convertir JPEG a PDF
- 27. ¿Convertir archivos TEX a PDF o DOCX?
- 28. ¿Cómo convertir un pdf a una imagen?
- 29. ¿Alguien puede recomendar una buena biblioteca de lectura de PDF para .Net?
- 30. ¿Buena biblioteca de inflexión para PHP?
El enlace arroja un error 404, actualice su respuesta. Gracias –
Listo: busque el complemento de rasterizador de PDF a DotImage Document Imaging –