2010-10-19 16 views
8

¿Hay una biblioteca de código abierto .Net para convertir la palabra dococument a HTML para mostrar el interior de la página web.Biblioteca para convertir texto del documento de Word a HTML

Conozco varias herramientas para convertir documentos de Word a archivos HTML, pero mis requisitos es para convertir el doc (ya sea desde el archivo o simplemente texto extraído) a HTML sobre la marcha de la aplicación ASP.Net.

me encontré con la biblioteca converting-a-word-document-into-usable-html-in-php PHP hacer la misma cosa, ¿hay alguna herramienta similar en .net?

+1

¿Por qué no convertirlo en un archivo y después lee el archivo HTML? –

+1

ya que es una opción final, si no hay manera, actualmente estamos almacenando doc como blob en dB, por lo que sería conveniente para convertir esto en cadena HTML que el almacenamiento de blob al sistema de archivos como doc e iniciar palabra de interoperabilidad para guardar como HTML y entonces léelo de la aplicación ... – RameshVel

Respuesta

2

Lo que desea convertir un archivo * .doc a HTML? ¿Guardarlo como un archivo HTML es una opción?

No es el método estándar .SaveAs que tiene la opción de guardar como HTML:

wdFormatHTML ahorra todo el texto y el formato con etiquetas HTML para que el documento resultante se puede ver en un explorador Web.

de: MSDN SaveAs Method

Un ejemplo tutorial sobre cómo utilizar el método para convertir .doc a un formato diferente se puede encontrar aquí: How to convert DOC into other formats using C#.

Si tiene archivos * .docx en lugar de archivos * .doc, es aún más fácil porque puede utilizar la API de OpenXML como se explica en MSDN aquí: Manipulating Word 2007 Files with the Open XML Format API (Part 1 of 3). Y si obtiene el XML del archivo de Word, puede, por supuesto, enviarlo a cualquier formato (HTML) que desee.

+0

sí, soy consciente de esta solución. – RameshVel

+0

bueno. responde a tu pregunta o me perdí algo? –

Cuestiones relacionadas