Hey, me gustaría para raspar algunos datos de mi blog a través de YQL:Cómo utilizar varios selectores XPath en una consulta YQL
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']"
¿Cómo puedo usar diferentes bits de XPath en mi consulta? P.ej. puedo hacer algo como:
SELECT * FROM html WHERE url="http://site.com/blog" AND xpath="//div[@class='post']" AND xpath ="//div[@class='title']"
asumiendo Deseo recibir el post y el título? Creo que podría tomar todo el HTML, pero preferiría tomar lo que necesito ya que la velocidad es un problema aquí.
Una vez que tengo el HTML Quiero extraer el texto del marcado, ¿está bien usar expresiones regulares de PHP para esto?
También entiendo que puede usar la sintaxis CSS, si tiene experiencia en usar esto con YQL y podría guiarme en cómo podría escribir una consulta similar a la anterior pero en CSS en lugar de XPATH ¡Le estaría muy agradecido!
Gracias.
Gracias, no estaba seguro acerca de la sintaxis, pero eso lo ha aclarado. –
¡Muy, muy útil! Gracias. – talkingnews
Upvoted ... Me di cuenta de esto pero quería saber si puedo dar un espacio o algo entre el resultado de dos xPaths, para que luego pueda analizar el resultado y obtener dos valores diferentes. – SoulMan