Superficialmente, una pregunta fácil: ¿cómo obtengo un PDF de excelente aspecto a partir de mi documento XML? En realidad, mi entrada es un subconjunto de XHTML con algunos atributos personalizados agregados (para guardar información sobre fuentes de citas, etc.). He estado explorando algunas rutas y me gustaría obtener algunos comentarios si alguien ha intentado algo de esto antes.XML to TeX o cómo obtener un hermoso PDF de fuente similar a XHTML
Nota: Considero que XSL-FO genera archivos PDF, pero escuché que la calidad tipográfica de las herramientas de código abierto todavía se está quedando atrás de TeX. Supongo que el más avanzado es Apache FOP. Pero estoy realmente interesado en un formato PDF muy atractivo (de lo contrario podría usar el diálogo de impresión de mi navegador). ¿Alguna idea, actualizaciones sobre esto?
Así que he estado pensando en usar XSLT para convertir mi dialecto XML/XHTML personalizado a DocBook y pasar de allí (DocBook via XSLT al HTML correcto parece funcionar bastante bien, así que también podría usarlo para eso). ¿Pero cómo voy de DocBook a TeX? He encontrado una serie de soluciones.
- dblatex Conjunto de hojas de estilos XSLT que generan LaTeX.
- db2latex Comenzó como un clon de dblatex pero ahora ofrece una integración más estrecha con los paquetes de LaTex y proporciona una sola secuencia de comandos para generar PDF, lo que es bastante agradable.
- passiveTex En lugar de XSLT usa un analizador XML escrito en TeX.
- TeXML es esencialmente una serialización XML del lenguaje LaTeX que se puede utilizar como un formato intermedio y una herramienta complementaria de python que se transforma de ese formato XML a LaTeX/ConTeXt. Ellos claimed que esto evita los problemas de las soluciones existentes con símbolos especiales, la pérdida de algunos apoyos o espacios y soporte solo para codificación latin-1. (¿Sigue siendo así?)
Como mi XML de entrada puede contener bastantes caracteres especiales representados en Unicode, el último punto es especialmente importante para mí. También he estado pensando en utilizar XeTeX en lugar de pdfTeX para solucionar este problema. (Podría perder algo de calidad tipográfica, pero tal vez sea mejor que los actuales procesadores XSL-FO de código abierto?) Así que db2latex y TeXML parecen ser los favoritos. Entonces, ¿alguien puede comentar sobre la solidez de esos?
Alternativamente, podría tener más suerte al usar ConTeXt directamente, ya que parece que hay bastante interest in the ConTeXt community in XML. Especialmente, podría echar un vistazo más profundo al "My Way: Getting Web Content and pdf-Output from One Source" y "Dealing with XML in ConTeXt MkIV". Ambos documentos describen un enfoque usando ConTeXt combinado con LuaTeX. (DocBook In ConTeXt parece hacer sobre el mismo, pero la versión más reciente es de 2003.) La segunda señala el documento:
Usted puede preguntarse por qué hacemos estas manipulaciones en TEX y no utilizar XSLT en su lugar. La ventaja de de un enfoque integrado es que simplifica el uso. Considere no solo procesar el documento , sino también usar xml para administrar recursos en la misma ejecución. Un enfoque xslt es tan detallado (después de todo, aún necesita producir código TEX) y probablemente menos legible. En el caso de MkIV, el enfoque integrado también es más rápido y nos da la opción de manipular contenido en tiempo de ejecución utilizando Lua.
¿Qué opina sobre esto? Tenga en cuenta que tengo algo de experiencia con XSLT y TeX, pero nunca he profundizado demasiado en ninguno de ellos.Nunca había probado muchos diferentes paquetes de látex o alternativas como el contexto (o XeTeX/LuaTeX en lugar de pdfTeX) pero estoy dispuesto a aprender algunas cosas nuevas para conseguir mis hermosas archivos PDF al final;)
Además, me tropecé con Pandoc pero no pudo encontrar ninguna información sobre cómo se compara con los otros enfoques mencionados. Y, por último, un enlace a una documentación bastante extensa en how to use TeXML with ConTeXt.
Esta pregunta parece ser más adecuada para http://tex.stackexchange.com/ –
@DaveJarvis Estaba buscando explícitamente alternativas a TeX. – mb21
ahhh, ¿no sería eso algo? Idealmente, un servicio web.Cargue un docbook lleno y obtenga un hermoso documento único listo para publicar y listo para leer;) –