Codigo muchos analizadores. Hasta ahora, estaba usando el navegador sin cabeza HtmlUnit para el análisis y la automatización del navegador.¿Qué analizador HTML es el mejor?
Ahora, quiero separar ambas tareas.
Como el 80% de mi trabajo implica solo un análisis sintáctico, quiero usar un analizador de HTML ligero porque lleva mucho tiempo en HtmlUnit cargar primero una página, luego obtener la fuente y luego analizarla.
Quiero saber qué HTML es el mejor analizador. El analizador sería mejor si está cerca del analizador HtmlUnit.
EDIT:
Por mejor, quiero al menos las siguientes características:
- velocidad
- Facilidad para localizar cualquier HTMLElement por su "ID" o "nombre" o "tipo de etiqueta".
Sería bueno para mí si no limpia el sucio código HTML. No necesito limpiar ninguna fuente HTML. Solo necesito una forma más fácil de mover a través de HtmlElements y recopilar datos de ellos.
¿Qué significa "mejor"? ¿Quiere decir velocidad, facilidad de transición de la implementación actual, cumplimiento de los estándares W3C, algo más en lo que no he pensado? Su pregunta implica velocidad, pero también implica tiempo de transición de desarrollo.Algunas aclaraciones pueden ayudar a otros a recomendar buenos analizadores sintácticos que se ajusten mejor a sus necesidades. – aperkins
Su afirmación 'Codigo muchos analizadores' no parece coincidir con la pregunta. ¿Quieres decir 'Necesito usar analizadores html mucho'? – blank
Creo que esta pregunta es lo suficientemente específica como para estar exento del motivo cerrado "no constructivo". –