Tengo un actualizador de sitio web (las personas pueden actualizar el contenido (texto) no el aspecto del sitio web) que tiene HTML, javascript como lenguajes frontales & python como parte de servidor/back-end.Mejor módulo de Python para análisis de HTML
Estoy descubriendo que la actualización de HTML es muy difícil desde el extremo anterior porque cuando me agarra el HTML actualizada por ele.innerHTML o $ (ELE) .html() da HTML alterada en función del navegador (MALDITO ES DECIR).
Así que han decidido actualizar mi HTML desde el servidor, es decir, en Python
¿Qué crees que es el mejor módulo de Python para analizar HTML & información de agarre?
Mis requisitos son:
- que el módulo sea al menos en Python 2.5 o menos (debido a mi servicio de hosting)
- Voy a análisis de HTML & encontrar todos los elementos HTML que son de la clase "actualizable"
- Para cada elemento de la clase "actualizable": extrae el texto interno (no solo texto/contenido html)
¿Qué módulo de python sugerirías es el mejor para esto?
- HTMLParser.py
- htmllib.py
- conozco ningún otro pitón de 2,5 módulos compatibles?
Beautiful Soup ahora parece estar activo de nuevo, con un lanzamiento del 3 de julio de 2012. http://www.crummy.com/software/BeautifulSoup/ – jforberg
¡De hecho, eso es una gran noticia! – David