Soy nuevo en XPath. Estoy tratando de analizar una página usando XPath. Necesito obtener información de la etiqueta, pero el apóstrofo que se escapó en el título lo estropea todo.Etiqueta de análisis Python XPath con el apóstrofo
Para el análisis utilizo Grab.
etiqueta de la fuente:
<img src='somelink' border='0' alt='commission:Alfred\'s misadventures' title='commission:Alfred\'s misadventures'>
XPath real:
g.xpath('.//tr/td/a[3]/img').get('title')
devoluciones
commission:Alfred\\
¿Hay alguna manera de solucionar este problema?
Gracias
Honestamente, debería estar contento de que '.xpath' devuelva algo. Este HTML no es lo suficientemente válido para que el módulo 'html' de LXML se ahogue en él. –
Acabo de experimentar con lxml y BeautifulSoup, y ninguno de ellos lo analizó correctamente tampoco. Obviamente, las comillas externas para los valores de los atributos deben ser comillas dobles. ¿Cuál es la fuente del html? – ekhumoro