Parece que todas las preguntas en stackoverflow donde el asker está usando regex para obtener algo de información de HTML inevitablemente tendrá una "respuesta" que dice que no se debe usar regex para analizar HTML.Usar expresiones regulares para analizar HTML: ¿por qué no?
¿Por qué no? Soy consciente de que hay analizadores HTML "reales" de comillas entre comillas, como Beautiful Soup, y estoy seguro de que son potentes y útiles, pero si solo estás haciendo algo simple, rápido o sucio, ¿por qué molestarse? usando algo tan complicado cuando algunas declaraciones de expresiones regulares funcionarán bien?
Por otra parte, ¿hay algo fundamental que no entiendo acerca de la expresión regular que los hace una mala elección para el análisis en general?
creo que esto es una víctima de http://stackoverflow.com/questions/133601 – jcrossley3
Debido a que sólo Chuck Norris * puede * analizar HTML con expresiones regulares (como se explica en esta famosa frase de Zalgo: http://stackoverflow.com/questions/1732348/regex-match-open-tags-ex cept-xhtml-self-contained-tags). – takeshin
Esta pregunta me llevó a preguntar otra que de alguna manera está relacionada. En caso de que esté interesado: [Por qué no es posible usar expresiones regulares para analizar HTML/XML: una explicación formal en términos simples] (http://stackoverflow.com/q/6751105/146792) – mac