2010-08-11 22 views
32

¿Puedo hacer esta conversión con cualquier lenguaje de programación o biblioteca?¿Cómo convertir HTML a epub?

+1

¿Terminaste de conformarte con un proceso? Buscando una solución PHP yo mismo. – Saiboogu

+0

Creo que está interesado en esto: https://github.com/Grandt/PHPePub –

+0

Después de probar diferentes programas, creo que esto es mucho mejor: http://www.juliansmart.com/ecub Aunque no es de código abierto . –

Respuesta

13

Calibre admite una amplia variedad de formatos de entrada, incluido HTML, y una amplia variedad de formatos de salida, incluido EPUB, pero no es "un lenguaje de programación o biblioteca". ¿Hay razones específicas por las que desea un enfoque basado en programación en lugar de una herramienta autónoma? Si es así, quizás Python y ebookmaker.py, por ejemplo, podrían ayudarlo.

+1

Quiero automatizar un proceso. –

+5

calibre se puede ejecutar desde la línea de comandos – Mark

+0

De acuerdo ... Lo he usado desde la línea de comandos, integrado con algunos scripts bash. Bueno para libros pequeños. Mis pubs más grandes creados por Calibre nunca pasan la validación. – Paulb

1

Aquí está pdf to epub, sé que eso no es lo que buscas, pero es un comienzo.

El paquete calibre puede tener lo que quiere

46

La respuesta corta es sí, se puede hacer en cualquier lenguaje de programación.

pasos básicos:

  1. convertir su HTML a XHTML (+ CSS). Esto puede hacerse en su programa o mediante un archivo XSLT.
  2. Copie sus archivos (XHTML, CSS, cualquier imagen y fuente) en una estructura de directorios que siga el formato.
  3. Zip la estructura del directorio y nombre el archivo con la extensión ".epub".

Algunos sitios de Internet para ayudarle a empezar:

de junio de el año 2015 Nota: El validador EpubCheck ha pasado de código de Google a GitHub ; tenga en cuenta la nueva URL.

0

Tengo el mismo problema anteriormente, porque quiero leer el contenido de algunas páginas web sin conexión en mi iPad. No tengo ni idea y no soy experto en informática. Hay calibre o estrofa blabla ....

Pero para mí son solo convertidores de formatos y necesito un creador de libros ePub que me permita combinar muchos documentos deseados para leer. Luego encontré un bookish html to ePub converter, guardo la página html de la web y luego la convierto con ella. Es una herramienta bastante buena para mí ahora.

2

Una respuesta tardía, pero encontré el ebookmaker basado en Python 3 como valioso, al menos después de que contribuí con una solicitud de extracción para eliminar una lista de materiales UTF-8. Un problema con esto parece ser que usa brittle regular expressions to parse HTML, pero creo que tendré que informarlo allí.

1

Acabo de empezar a implementar una herramienta de este tipo en Java (compatible con OpenJDK): html2epub. Para deshacerme de la edición manual del archivo de configuración, probablemente iniciaré una herramienta separada para generar el archivo de configuración desde cualquier directorio (sin embargo, aún sería necesario determinar el orden de los XHTML en el EPUB - para no -puede considerarse el uso programático, el desarrollo de una herramienta de ayuda GUI, para una solución programática completamente flexible, todavía no he tenido una idea). Antes de eso, implementé los convertidores basados ​​en script de shell para la entrada XML personalizada (hag2epub tools) - en caso de que estuviera interesado, probablemente los transfiriera a la entrada XHTML (con un archivo de configuración para los metadatos EPUB u obteniendo metadatos del index.html superior) de un directorio, si existe).

+0

si la licencia bajo Apache 2.0 sería una buena opción para muchas personas, ya que está bajo AGPL y no puedo usarlo. its pitty :( –

+0

¿Podría decirme cómo la AGPL podría bloquear su uso? – skreutzer

+0

no se puede usar AGPL en el producto comercial –