Estoy haciendo un proyecto en el que necesito leer un archivo HTML e identificar etiquetas específicas, modificar el contenido de la etiqueta y crear un nuevo archivo HTML. ¿Hay una biblioteca que analiza las etiquetas HTML y puede volver a escribir las etiquetas en un nuevo archivo?Cómo analizar y modificar un archivo HTML en Java
Respuesta
si desea modificar la página web y devolver el contenido modificado, creo que la mejor manera es usar la transformación XSL.
http://en.wikipedia.org/wiki/XSLT
Mire http://java-source.net/open-source/html-parsers para obtener una lista de las bibliotecas de java que analizan los archivos html en objetos java que se pueden manipular.
Si los archivos html con los que está trabajando están bien formados (xhtml), entonces también puede usar las bibliotecas XML en java para buscar etiquetas específicas y modificarlas. El IO en sí debe ser manejado por las bibliotecas particulares que está utilizando.
Si elige analizar manualmente las cadenas, podría usar expresiones regulares para buscar etiquetas específicas y usar las bibliotecas de Java para escribir en los archivos y crear nuevos documentos html. Pero este método reinventa la rueda, por así decirlo, porque tiene que administrar la apertura y el cierre de etiquetas, y todas esas cosas son manejadas por bibliotecas preexistentes.
Salida http://jsoup.org, tiene una API DOM-como amigos, para tareas sencillas que no es necesario para analizar el html.
- 1. Cómo analizar HTML para modificar todas las palabras
- 2. Modificar un archivo .txt en Java
- 3. ¿Cómo usar expresiones regulares para analizar HTML en Java?
- 4. ¿Cómo puedo analizar una cadena HTML en Java?
- 5. Cómo analizar y modificar programáticamente el código C#
- 6. Cómo analizar un archivo CSV en Bash?
- 7. ¿Cómo descargar y analizar un archivo csv en Racket?
- 8. Cómo analizar un archivo Excel en JavaScript?
- 9. Cómo analizar un archivo tar en C++
- 10. ¿Cómo puedo modificar un archivo zip solo en la memoria?
- 11. ¿Cómo modificar un archivo de texto?
- 12. ¿Es posible modificar líneas en un archivo en el lugar?
- 13. Cómo analizar solo texto de HTML
- 14. Cómo analizar HTML desde JavaScript en Firefox?
- 15. Cómo analizar HTML mal formado en python
- 16. jQuery - modificar cadena HTML
- 17. Cómo analizar WSDL en Java?
- 18. ¿Cómo buscar y analizar un archivo XML con AppleScript?
- 19. Analizar y reproducir un archivo .pls en Android
- 20. Cómo analizar un archivo .plist con php?
- 21. cómo puedo analizar un archivo dtd
- 22. PHP analizar HTML
- 23. analizar un archivo XML en Qt
- 24. Modificar un archivo grande en Scala
- 25. Cómo analizar un archivo yaml desde un servicio en Symfony2
- 26. Impresión de archivo HTML en la impresora en java
- 27. Escribir archivo HTML con Java
- 28. Javascript analizar html, modificar las etiquetas de anclaje que contienen imágenes
- 29. En Java, ¿cómo creo un archivo temporal solo en memoria para analizar xml?
- 30. PHP - analizar un archivo txt
Supongo que esto era lo que estaba esperando. Necesito generar informes y presentarlos en el formato que el usuario desea que se presenten. – chai
Actualmente estoy usando el procesador Xalan y el código funciona muy bien. Aquí está el enlace para el procesador http://xml.apache.org/xalan-j/ – chai