2010-03-31 9 views
12

Tengo una página mal formada para raspar, y me ha costado obtener el XPath correcto para YQL. Puedo raspar campos individuales que necesito utilizando, por ejemplo:YQL Cómo utilizar el comodín en XPath

//*[@id="cell_12345"] 

Pero lo que realmente hay que hacer es devolver todos los elementos que de Identificación comienza con cell_. Algo como:

//*[@id="cell_"*] 

¿Cómo puedo hacer esto?

Además, si alguien puede indicarme una buena referencia de XPath sería muy útil.

Gracias!

Respuesta

27

Algo así como

//*[starts-with(@id, 'ceil_')] 

debe hacer muy bien.

En cuanto a una referencia xpath, una vez que conozca la sintaxis y el eje, cualquier referencia de función anterior debería ayudar. Este fue el primero en google: http://www.w3schools.com/xpath/xpath_functions.asp

+0

Gracias Paul. Esto funciona. :) – user191688

+0

Encontré que contiene() funcionó para mí. gracias Paul. –

+0

¿Alguna idea de cómo ver la imagen y metadescripción de amazon.in/Seiko-Premier-Analog-Blue-Watch/dp/...? –

Cuestiones relacionadas