Me gustaría obtener algún consejo sobre cómo crear y visualizar un mapa de enlaces entre los blogs para reflejar la "red social" entre ellos.¿Asignación de la red de enlaces entre blogs usando R?
Así es como pienso en hacerlo:
- empezar con uno (o más) la página principal del blog y recoger todos los enlaces de la página
- eliminar todos los enlaces que se encuentran los enlaces internos (es decir, si comienzo desde www.website.com. Entonces quiero eliminar todos los enlaces de la forma "www.website.com/***"). Pero almacena todos los enlaces externos.
- Vaya a cada uno de estos enlaces (suponiendo que no los haya visitado ya), y repita el paso 1.
- Continúe hasta (digamos) X salta desde la primera página.
- Grafica los datos recopilados.
me imagino que con el fin de hacer esto en I, se podría usar RCurl/XML (Gracias a Shane por su respuesta here), combinado con algo como igraph.
Pero dado que no tengo experiencia con ninguno de ellos, ¿hay alguien aquí que pueda estar dispuesto a corregirme si omitiera algún paso importante, o adjuntar algún fragmento de código útil para permitir esta tarea?
ps: Mi motivación para esta pregunta es que en una semana daré una charla sobre useR 2010 sobre "blogging y R", y pensé que esta podría ser una buena manera de dar algo divertido a la audiencia y también motívelos a hacer algo como esto ellos mismos.
¡Muchas gracias!
Tal
Muchas gracias Drew, voy a intentarlo (espero hacerlo a tiempo). –