¿Existe una forma razonable de extraer texto sin formato de un archivo de Word que no dependa de la automatización COM? (Esta es una función para una aplicación web implementada en una plataforma que no es de Windows; en este caso no es negociable)¿La mejor manera de extraer texto de un documento de Word sin usar COM/automatización?
Parece que Antiword podría ser una opción razonable, pero parece que podría abandonarse.
Una solución de Python sería ideal, pero no parece estar disponible.
Tenga en cuenta que Python 3 elimina popen3, ver https://docs.python.org/3/library/subprocess.html # replace-os-popen-os-popen2-os-popen3 – codeape