Quiero analizar algo de HTML con el fin de encontrar los valores de algunos atributos/etiquetas etc.bibliotecas análisis de HTML me recomiendan en Java
Lo HTML analizadores me recomienda? Cualquier pros y contras?
Quiero analizar algo de HTML con el fin de encontrar los valores de algunos atributos/etiquetas etc.bibliotecas análisis de HTML me recomiendan en Java
Lo HTML analizadores me recomienda? Cualquier pros y contras?
He intentado HTML Parser que es muy simple.
He utilizado HTML parser en un proyecto y funcionó exactamente como esperaba –
pero no hay muchos tutoriales disponibles ... – Lily
He notado una gran cantidad de fragmentos de JavaScript (y atributos de elementos) que se arrastran hacia mi supuestamente "nodo de texto" "extracciones" También ha habido algunos casos en los que el formato incorrecto de HTML provocó el error de toda la operación de análisis. Así que estoy buscando reemplazar la biblioteca htmlparser en mi propio proyecto con algo un poco mejor. – benjismith
¿Necesita hacer un análisis completo del HTML? Si solo busca valores específicos dentro de los contenidos (un tag/param específico), entonces una expresión regular simple podría ser suficiente, y podría muy bien ser más rápida.
XPath es el camino para el análisis de HTML, ayuda en el caso de HTML mal formado, así como regex falla. –