2010-10-12 16 views
6

que deseen acceder a la API de herramientas de mi webmasters de Google a través de R.Sugerencias sobre cómo acceder a la api de las herramientas de google webmaster a través de R?

veo desde aquí:

http://code.google.com/apis/webmastertools/docs/2.0/reference.html

que requiere ir a buscar una fuente detrás de https y analizarlo.

¿Alguna sugerencia sobre cómo hacerlo?

+0

Quizás puedas adaptar este código desde sorenmacbeth http://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R –

+0

Gracias Brandon, ese fue mi plan alternativo: me preguntaba si alguien más ya tenía tocado el tema. –

Respuesta

0

Supongo que podría usar el Java client con rJava.

+0

Hola Matti, podrías ser un poco más específico, no estoy seguro de cómo hacerlo. –

+0

Para el lado java de las cosas, hay algunos ejemplos http://code.google.com/intl/fi-FI/apis/webmastertools/docs/2.0/developers_guide_java.html, como llamarlo desde rJava, creo que necesitas para referirse a su documentación. Yo no soy un programador de Java, pero hay muchos proyectos que usan rJava con éxito. –

+1

La fuente de RGoogleData también puede brindarle algunos consejos r-forge.r-project.org/projects/rgoogledata/ –

2

Basado en Google, diría que la biblioteca RCurl es su mejor apuesta para HTTP. Tienen un buen ejemplo sobre cómo hacer algunas operaciones básicas y funcionan con una carga XML: http://www.omegahat.org/RCurl/xmlParse.html

Al igual que otros servicios GData, la api de herramientas webmaster es AtomPub-based XML. Debería ser bastante fácil de analizar utilizando la biblioteca XML, pero tendrá que codificar usted mismo.

Googleanalytics4r mencionado por Brandon tiene este mismo enfoque. Ver: https://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R

0

Es un poco raro, pero accedo a los datos de GWT de R a través de la herramienta de python aquí (http://code.google.com/p/webmaster-tools-downloads/source/browse/downloader.py), emitiendo comandos de sistema(), p.

feedback <- system("python ./gwt-tool/googlewebmastertool_download_gmt.py") 

Donde "retroalimentación" será el mensaje generado a partir de la secuencia de comandos y los archivos aparecen en el directorio de trabajo de la llamada al sistema.

Una mejor solución sería usar el paquete httr para realizar las solicitudes (que es un envoltorio para RCurl sugerido anteriormente). He descubierto que httr alisa algunos de los problemas de configuración que RCurl puede presentar.

Cuestiones relacionadas