2010-11-19 10 views
9

Estoy usando pisa, que es una biblioteca de conversión de HTML a PDF para Python.html to .doc converter en Python?

¿Existe lo mismo para un documento de Word: una biblioteca de conversión de HTML a .doc para Python?

+0

¿Por qué quieres esto? MS Word puede leer HTML. – MSalters

+0

Tengo el mismo problema: tengo un html que usa pisa para convertir a pdf y quiero hacer lo mismo con la palabra. es un documento grande, ~ 20 páginas, usar la misma pieza de código para generar el html y luego exportar a través de pisa u otra cosa sería genial. –

+0

@Eric: Recientemente, tuve el mismo problema. Solo me preguntaba, ¿encontraste una solución para convertir HTML a Word .docx? Gracias. –

Respuesta

3

Aunque no soy consciente de un módulo directa que puede permitirá convertir esto, sin embargo:

  1. Puede convertir HTML a texto plano primero usando el módulo html2text.
  2. Después de eso, se puede utilizar este módulo python-docx para convertir el texto en un documento o un archivo docx .
9

Usted podría utilizar win32com de los pywin32 extensiones de Python para Windows, para que MS Word convertir por usted. Un ejemplo sencillo:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit()