Tengo algunos archivos .tex de los cuales quiero recibir el texto plano sin etiquetas de latex como \ section {...} o \ newpage.
¿Alguien tiene alguna idea sobre cómo lograr esto? También tengo el archivo .pdf, pero cuando simplemente copio el código de allí, algunas palabras se concatenan, lo que es realmente malo.
¿Hay alguna herramienta que conozca?extraer texto de tex, eliminar etiquetas de latex
Respuesta
Por favor ver la OpenDetex GitHub page para la versión más reciente de OpenDetex. Es una versión derivada más moderna de mi DeTeX original.
Mi legado DeTeX home page está disponible here.
Si solo desea la fuente heredada detex-2.8.tar, puede obtenerla here.
opendetex está disponible tanto para Windows y Linux
descarga el programa opendetex de aquí
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list
Uso: http://code.google.com/p/opendetex/wiki/Usage
extraerlo en cualquier directorio de su elección . Digamos que lo extrae al directorio de descargas.
haga otro directorio de cualquier nombre en eso (opcional, pero es bueno si usted crea). diga que el nombre del directorio es "my_paper". Coloque su papel en el directorio "my_paper". diga su nombre de papel es project.tex
Navegar por el camino
cd ~/Downloads/opendetex
Ejecutar el comando
detex -n my_paper/project.tex > out.txt
forma genérica
detex -n full_path_to_tex_file.tex > output_text_file.txt
- 1. cómo extraer texto fuera de las etiquetas xml
- 2. Código fuente de libros realizados con TeX/LaTeX para aprender
- 3. Latex - extraer caracteres de subcadena/ignorar
- 4. Conversión/análisis programático de código LaTeX a texto sin formato
- 5. NSRegularExpression para extraer texto entre dos etiquetas XML
- 6. Tex vs. Latex: ¿Vale la pena el cambio?
- 7. Texto y gráficos en Matlab a LaTeX
- 8. ¿Cuál es la mejor manera de entender las partes internas de TeX/LaTeX?
- 9. Si TeX es un lenguaje de programación, ¿cómo podría comenzar a programar en TeX?
- 10. ¿Cómo eliminar el texto entre las etiquetas en php?
- 11. Extraer texto del PDF
- 12. Referencia de LaTeX y Makefile
- 13. Extraer JSON del texto
- 14. Eliminar etiquetas XML vacías
- 15. BeautifulSoup para extraer el texto entre los saltos de línea (por ejemplo, <br /> etiquetas)
- 16. XPath para extraer texto después de las etiquetas br en I
- 17. Referencias con texto en LaTeX
- 18. Detener la apertura de tex-shell al compilar Latex desde Emacs
- 19. Extraer palabras de un archivo de texto
- 20. R, Sweave, LaTeX: variables de escape para imprimir en LaTeX?
- 21. cómo insertar el símbolo de tubería en TeX?
- 22. Extraer texto de archivos PDF y de Word
- 23. Representador de LaTeX para .NET?
- 24. Extraer texto de archivos PDF en C#
- 25. ¿Cómo extraer texto de un archivo PSD?
- 26. ¿Cómo extraer texto de un PDF?
- 27. Extraer URL de texto en PHP
- 28. Cómo extraer URL del texto
- 29. Compilar el archivo XeLaTeX tex con latexmk
- 30. Eliminar espacio antes \ capítulo en LaTeX
No hay de qué! –
Solo funciona en archivos de texto ASCII. Si está utilizando xelatex y archivos de texto codificados en UTF-8 con caracteres no ASCII, detex genera basura para los caracteres no ASCII. – Lucas
Es de código abierto, siempre podría ser reparado. –