¿Hay un archivo .dll que pueda usar, que use el archivo .pdf como archivo de entrada y .html como salida? Quiero convertir .pdf a .html. Mi colega dice que es muy difícil ir paso a paso, obtener texto/fuente/imagen/márgenes/enlaces, etc. desde el pdf y luego crear un nuevo archivo html con el mismo contenido. Él dice que es casi imposible. Así que estaba pensando, ¿hay alguna DLL que pueda usar como referencia para hacer eso?C# convirtiendo pdf a html
Respuesta
Escribir un programa para hacerlo definitivamente no es trivial. Si no encuentra ninguna biblioteca .NET para hacer esto (no pude, al menos no es gratis), solo llamaría download this e invocara programáticamente para obtener mi html.
Si tiene tiempo de sobra y/o PDFToHtml no produce resultados aceptables para usted, puede use iText escribir el programa usted mismo. Es una biblioteca de pdf gratuito muy madura. Lo he usado en el pasado para manipular archivos PDF (fusionar, crear, etc.).
ACTUALIZACIÓN
Como se señaló en el comentario de dilema, la biblioteca PDFSharp ofrece una licencia más relajado (MIT) en comparación con la licencia comercial o AGPL ofrecido por iText. Mantenga esto en mente cuando elija su biblioteca. No he usado la biblioteca PDFSharp y no sé cómo se comparan en términos de funcionalidad.
Si alguien hace esto, mejor use pdfsharp, tiene la mejor licencia. –
En las preguntas frecuentes de PDFSharp, afirman que su biblioteca no convierte PDF a HTML y no tienen planes para admitirlo. http://www.pdfsharp.net/wiki/pdfsharpfaq.ashx#Can_I_use_PDFsharp_to_convert_PDF_to_Word_RTF_HTML_11 –
Si no te importa pagar, Aspose ofrece una muy buena solución, esto es lo que usamos en mi empresa.
http://www.aspose.com/categories/.net-components/aspose.pdf-for-.net/key-features.aspx
Nosotros, también. Además, recientemente apareció el producto [Spire] (http://www.e-iceblue.com/), que proporciona herramientas similares a Aspose. –
se puede descargar esta herramienta gratuita: PDFToHTML
Luego, en su programa solo tenedor Un nuevo proceso y ejecute el archivo ejecutable que pasa el archivo PDF. Acabo de probarlo ahora y parece funcionar bien.
- 1. Convirtiendo HTML a PDF usando PHP?
- 2. Convirtiendo html a pdf en php?
- 3. Convertir archivo PDF a HTML en C#
- 4. Exportar HTML a PDF (C++, Windows)
- 5. Exportación de HTML a PDF (C#)
- 6. ¿Documento HTML a PDF?
- 7. Convertir PDF a HTML
- 8. HTML dinámico a PDF
- 9. Convertir PDF a HTML
- 10. convertir HTML a PDF
- 11. PDF a HTML en iPhone
- 12. Convirtiendo código IL a C#
- 13. HTML a PDF en ASP.NET
- 14. Enviar formulario HTML a PDF
- 15. html a pdf con wkhtmltopdf
- 16. Rieles: ¿Convertir HTML a PDF?
- 17. Conversión de HTML a PDF (no PDF a HTML) usando PHP
- 18. Convirtiendo bool a texto en C++
- 19. convirtiendo decimal a int en C#
- 20. Convirtiendo SVG a PNG usando C#
- 21. Conversor de HTML a PDF Winnovative
- 22. Android - cómo convertir html a pdf?
- 23. Conversión de HTML a PDF en iOS?
- 24. Conversión de PDF a HTML con Python
- 25. Usando iText para convertir HTML a PDF
- 26. Html a PDF con webkit transform
- 27. HTML y CSS a PDF en JavaScript
- 28. HTML a PDF A4 tamaño imprimible
- 29. Convirtiendo secuencias de escape ANSI a HTML usando PHP
- 30. convirtiendo archivos bibtex a html con python (tal vez pybtex?)
Es complicado, pero ¿por qué lo quieres? –
hay varias herramientas de conversión html a pdf que los proveedores ofrecen, pero no vi ningún pdf a html. Como no sé si la versión completa puede exportar a html, primero debe verificar esto y ver los resultados. Entonces quizás puedas realizar algunos trabajos por lotes que usan acrobat todo. Solo una idea ... – YvesR
Una búsqueda web para "convertir PDF a html" reunirá muchas soluciones posibles. SO no es un buen lugar para sugerencias de productos, por lo tanto, la votación se cierra como "no constructiva". – Richard