2011-07-09 9 views
5

YQL Console LinkYQL ¿Perder atributos de elemento HTML?

consulta:

select * from html where url='http://www.cbs.com/shows/big_brother/video/' and xpath='//div[@id="cbs-video-metadata-wrapper"]/div[@class="cbs-video-share"]/a' 

Devuelve:

<?xml version="1.0" encoding="UTF-8"?> 
<query xmlns:yahoo="http://www.yahooapis.com/v1/base.rng" 
    yahoo:count="1" yahoo:created="2011-07-09T23:14:02Z" yahoo:lang="en-US"> 
    <diagnostics> 
     <publiclyCallable>true</publiclyCallable> 
     <url execution-time="146" proxy="DEFAULT"><![CDATA[http://www.cbs.com/shows/big_brother/video/]]></url> 
     <user-time>163</user-time> 
     <service-time>146</service-time> 
     <build-version>19262</build-version> 
    </diagnostics> 
    <results> 
     <a class="twitter-share-button" href="http://twitter.com/share"/> 
    </results> 
</query> 

debe devolver algo similar a:

<results> 
     <a href="http://twitter.com/share" data-url="http://www.cbs.com/shows/big_brother/video/2045825951/big-brother-episode-1" class="twitter-share-button"></a> 
    </results> 

Si se retira el nivel de consulta uno, totalmente tiras el elemento, que podría al así que utilicé para obtener los datos que necesito.

Respuesta

8

Tenemos un nuevo analizador html que reconoce ahora los atributos personalizados.

Agregue compat="html5" para activar el nuevo analizador.

ej .:

select * from html where url = "http://mydomain.com" and compat="html5" 
Cuestiones relacionadas