Se preferirá la implementación de código abierto.¿Hay alguna biblioteca de Java para convertir documentos de pdf a html?
6
A
Respuesta
2
Obviamente, no es una tarea fácil, el formato PDF es mucho más rico que uno de HTML (además de que hay que extraer imágenes y vincularlos, etc.).
La extracción de texto simple es mucho más simple (aunque no trivial ...).
Veo en la barra lateral de su pregunta una pregunta similar: Converting PDF to HTML with Python que apunta a una biblioteca (poppler, que aparentemente está escrita en C++, quizás se puede acceder con JNI/JNA) y a una pregunta relacionada que ofrece aún más respuestas.
1
1
Pruebe usar PDFBox de la base apache.
Cuestiones relacionadas
- 1. Convertir PDF a HTML
- 2. Convertir HTML a PDF - Cualquier biblioteca para ASP.net
- 3. Convertir PDF a HTML
- 4. Android: ¿Hay alguna biblioteca de PDF gratuita para Android?
- 5. convertir HTML a PDF
- 6. ¿Hay alguna alternativa de creación de PDF Java para iText?
- 7. Java - convertir html con imágenes en CSS a pdf
- 8. Usando iText para convertir HTML a PDF
- 9. Rieles: ¿Convertir HTML a PDF?
- 10. Biblioteca de PDF para Java
- 11. Biblioteca para convertir texto del documento de Word a HTML
- 12. ¿Hay alguna biblioteca ActiveResource como para Java?
- 13. ¿Hay alguna alternativa viable a wkhtmltopdf en Windows para la conversión de html a pdf?
- 14. ¿Hay alguna biblioteca para crear formularios y campos en PDF?
- 15. ¿Una buena biblioteca para convertir PDF a TIFF?
- 16. Convertir archivo PDF a HTML en C#
- 17. ¿Hay alguna biblioteca de Java para la generación de miniaturas?
- 18. ¿Cuál es una buena opción para convertir documentos de Office a PDF o Imagen
- 19. Convertir de PDF a Postscript usando Java
- 20. Android - cómo convertir html a pdf?
- 21. Biblioteca de ActionScript para convertir Markdown a HTML
- 22. una biblioteca Java para la conversión de XML/HTML a PDF
- 23. Conversión de HTML a PDF (no PDF a HTML) usando PHP
- 24. Lote Convertir PDF a XPS
- 25. ¿Cómo usar WkHTMLToSharp correctamente para convertir archivos HTML a PDF?
- 26. Convertir documentos de Excel a marcado wiki
- 27. Convertir html a doc en java
- 28. Biblioteca de Java Pdf Diff
- 29. PDF a HTML en iPhone
- 30. ¿Cómo convertir documentos a PDF en una pila de Linux/PHP?
Me gustaría saber una solución para esto también. PDFBox puede hacerlo (http://java.dzone.com/articles/converting-pdf-html-using?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+javalobby%2Ffrontpage+%28Javalobby+%2F+Java+Zone%29), pero de una manera muy limitada. – Alp