Quiero convertir todos los .odt .doc. .xls .pdf archivos a archivos .txt Quiero convertir estos archivos a archivos de texto usando shell script o script perlConvierte archivos .odt .doc .ods a archivos .txt
Respuesta
OpenOffice tiene un convertidor de documentos integrado capaz de manejar una gran cantidad de formatos-eche un vistazo a unoconv : http://dag.wieers.com/home-made/unoconv/
Dicho esto, he tenido algunos problemas para conseguir que funcione en el pasado. Si tiene problemas, consulte programas similares para AbiWord (otro procesador de textos de fuente abierta).
Es ciertamente posible hacer esto, aunque hay algo extraño e impenetrable sobre el proyecto OO y su documentación que hace que cosas como esta sean difíciles de investigar y seguir. Sin embargo, OO tiene la capacidad de convertir todos esos tipos, no solo los OO nativos, y puede hacerlo a través de dos formas diferentes de control automático.
Estos son los dos enfoques generales.
Puede iniciar OO y decirle que ejecute una macro que hace este trabajo para un determinado archivo. Luego solo tiene que escribir la macro y una secuencia de comandos para recorrer sus archivos. La sintaxis es algo así como
$ comando oowriter -headless macro de nombre de archivo: //dir/Standard.Module1.sMySub
La otra cosa OO tiene es una API de red. Esto se basa en algo llamado UNO.
$ comando oowriter -accept = aceptar cuerdas
Notifies the OpenOffice.org software that upon the creation of "UNO Acceptor Threads", a "UNO Accept String" will be used.
Usted necesitará algún tipo de biblioteca de cliente. Creo que tienen uno para Python al menos. Al usar esta tecnología, un programa Python u otro lenguaje de scripting con una biblioteca cliente OO podría conducir el programa y convertir todos los archivos. Como OO lee MSO, debería poder hacer todos ellos.
Para documentos de Word, puede probar antiword
, al menos en Linux. Es una utilidad de línea de comandos que toma un documento de Word como argumento y escupe el texto de ese documento (lo mejor que puede figurar) en Salida Estándar. Quizás también puedas especificar un archivo de salida. No recuerdo los detalles de cómo funciona. No lo he usado por un tiempo. No estoy seguro si puede manejar documentos OO.
Para los formatos de Microsoft, mira en el wvWare tools.
$ unoconv --format=txt document1.odt
Debe producir document1.txt.
Abrir.archivo ods normalmente en LibreOffice
el texto para ser convertido
Abrir un terminal
Ejecutar vi
Prensa "i" para obtener el modo de inserción
Presione Ctrl-Shift-V
¡Hecho!
¿Necesita un poco de formateo?
Guardar el archivo como
Sal de vi
Run:
$ cat | columna> nombrearchivo2
Esto funcionó en openSUSE ejecutando KDE
Sustituto "kwrite" para "vi", si desea
- 1. Convierte archivos Word doc o docx en archivos de texto?
- 2. Conversión de HTML a odt, doc, docx
- 3. ¿Cómo crear archivos .odt con C# .NET?
- 4. Cómo convertir ODT a DOC/RTF sin openoffice.org
- 5. lectura de archivos odt en php
- 6. Convierte .doc a html en php
- 7. cómo compartir documentos ODT/doc más de git
- 8. Generar ODT/DOC (X) y convertir a PDF, sin OO.o/MS
- 9. ImageMagick no convierte archivos JPEG
- 10. ¿Cómo puedo generar un documento (.rtf, .doc, .odt) desde R
- 11. Archivos comprimidos que controlan la versión (docx, odt)
- 12. encontrar y eliminar archivos .txt en bash
- 13. Vim NERDTree: mostrar solo archivos .txt?
- 14. Sirviendo archivos .docx a través de Php
- 15. cómo leer archivos .doc, .docx, .xls en android
- 16. Obtener PHP para leer archivos .doc en Linux
- 17. SDK para leer archivos PPT, xls y .doc en iOS
- 18. Cómo excluir archivos fuente java en la tarea doc?
- 19. Cómo indexar archivos .doc y .pdf en asp.net
- 20. IntelliJ Idea 10: cómo desactivar la autocompletación en archivos .txt
- 21. Descargar varios archivos FTP como d * .txt en ruby
- 22. Buscar texto específico en múltiples archivos TXT en PHP
- 23. ¿Dónde busca Visual Studio archivos txt al realizar operaciones de administración de archivos?
- 24. Construir imágenes y algunos archivos de configuración como archivos txt y xml con pyinstaller
- 25. Cómo almacenar archivos .txt Base de datos MySQL?
- 26. Comparando dos archivos .txt usando difflib en Python
- 27. ¿Cómo se lee en múltiples archivos .txt en R?
- 28. Java: encuentre archivos .txt en la carpeta especificada
- 29. ¿Forma confiable y rápida de convertir un trillón de archivos ODT en PDF?
- 30. .o archivos vs .a archivos
hi no pude conseguir ti. ¿Serías más específico? Por favor, ayúdeme ya que necesito convertir archivos Odt a archivos txtx lo antes posible – Akhtar
OK, he actualizado mi respuesta para aclarar las cosas. Agregaré más cosas aquí más tarde hoy, regresaré en 6 o 12 horas ... – DigitalRoss