2010-10-23 18 views
7

estoy tratando de buscar dentro de la caché de Google, por lo que necesitan para disparar esta consulta:Cualquier API para buscar en Google Cache?

http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news 

Y conseguir algo de contenido como fecha y hora de la página. Pero cuando hago esto usando curl (ruby), se da un error de permiso denegado, es decir, el raspado está bloqueado y eso se esperaba.

Entonces, ¿hay alguna manera de buscar en Google Cache (ya sea una API o algún tipo de raspado de la solución) y extraer algo de información como la marca de tiempo?

Respuesta

2

No recibí ninguna API pero puedo rasparla usando hpricot o nokogiri en rieles (curl en Rails da permiso denegado error). Pondré el código una vez que descubro cómo extraer la marca de tiempo de la URL anterior utilizando estas gemas.

¿Alguien tiene una mejor solución?