2010-12-02 12 views
8

que desea recuperar viejos búsquedas de Google que he hecho un par de años/meses atrás y que están presentes en la historia de la web de Google. ¿Cómo puedo recuperarlos programáticamente?Recuperar búsquedas de Google viejos historial web

https://www.google.com/history/?output=rss sólo proporciona las últimas búsquedas de Google, pero no todos ellos.

también esta pregunta: How can I retrieve my Google search history? no proporciona ninguna respuesta para mi pregunta!

+0

favor no mencionan que ir a cada página y analizar hTML y luego obtener el data.Looking requiere de algún servicio o piensos o así .. – Pratik

Respuesta

14

se puede pasar el mes, día y año como parámetros para obtener la historia de un día específico.

E.g. https://www.google.com/history/lookup?month=12&day=1&yr=2010&output=rss para diciembre, 2010. 1

No hay formas de obtener la historia de todo un mes o un año, por no hablar de toda la historia. Pero esta información sobre los parámetros debe al menos permitirle obtener el historial completo en algún ciclo que va un día más atrás en el tiempo cada vez. Tenga cuidado de no emitir demasiado en muy poco tiempo.

+0

1 me pregunto por qué esto no ha sido elegida como la respuesta correcta. el – Zevan

+0

servidor remoto devolvió un error: (401) no autorizado. – Pratik

+0

El servidor remoto devolvió un error: (504) Tiempo de espera de puerta de enlace. Un – Pratik

3

creo que esto va a ser muy difícil.

sé esto no responde a usted pregunta por completo, pero al menos las páginas web se pueden conservar. Existen organizaciones y herramientas que le permiten recrear páginas web de fechas anteriores; consulte, por ejemplo, http://www.mementoweb.org/.

ACTUALIZACIÓN: He aprendido que simplemente Memento ha ganado un premio de la preservación digital (http://www.dpconline.org/newsroom)

4

Realmente es necesario analizar la página HTML por página y luego ir a buscar sus datos, porque no creo que haya ninguna alternativa!

3

Sé que no está buscando volver a pasar por todas las páginas, pero que realmente no necesita para analizar toda la página, sólo tiene que buscar el código HTML que siempre precede a una entrada. De mí sólo puesta en marcha de la historia google web y hacer algunas búsquedas simples, si se mira a través de una página de la historia, cada cadena que ha buscado la siguiente manera: <td style="padding:3px 0"><table id=bkmk_view_ class=noborder ><tr><td><table class="elem noborder"><tr><td class="grey" nowrap>Searched for&nbsp;</td><td nowrap><a title="http://www.google.com/search?q= y es seguido por & (comercial). Esta secuencia de html anterior es única en la página, solo aparece cuando se enumeran los términos de búsqueda histórica.

Si utiliza dos términos, se obtiene un + entre los términos. Otras convenciones para diferentes modos de búsqueda, no las revisé todas.

Parece que si utiliza el método de BalusC para pasar parámetros, entonces puede recuperar el html, buscar en el documento la cadena que mencioné (asegúrese de \ "y otros caracteres especiales), luego copie la siguiente cadena hasta que llegar a un personaje &. entonces, todo lo que tiene que hacer es analizar el término de búsqueda, no la página entera. ir a través de código fuente hasta llegar a la final, y luego ir a la siguiente iteración del bucle.

2
static void GetGoogleWebHistory(int month, int day, int yr, string UserName, string Pass) 
{ 
    string iURL = "http://www.google.com/history/lookup?month=" + month + "&day=" + day + "&yr=" + yr + "&output=rss"; 
    WebClient client = new WebClient(); 
    GDataCredentials gdc = new GDataCredentials(UserName, Pass); 
    RequestSettings rs = new RequestSettings(Guid.NewGuid().ToString(), gdc); 
    XmlDocument XDoc = new XmlDocument(); 
    XDoc.LoadXml(client.DownloadString(iURL)); 
} 
+0

No soy un desarrollador web (tengo algo de experiencia en programación) así que me gustaría tomar esto y usarlo? ¿Cree una página HTML con este código de JavaScript y luego cree una tabla HTML a partir del XML?Sé que esta pregunta fue hace mucho tiempo, pero aún estoy buscando una solución para esto. – stephenmm

Cuestiones relacionadas