2008-10-03 10 views
6

Estoy trabajando en un proyecto que requiere un acceso confiable a entradas de alimentación históricas que no están necesariamente disponibles en la fuente actual del sitio web. He encontrado varias formas de acceder a esos datos, pero ninguno de ellos me da todas las características que necesito.Acceso a entradas de alimentación antiguas, ya no está disponible

Mire esto como una lluvia de ideas. Le diré cuánto he encontrado y puede contribuir si tiene alguna otra idea.

  1. Google AJAX Feed API - Usted limitar a 250 artículos

  2. Unofficial Google Reader API - (? Y quizás cuasi ilegales) perfectos, pero no oficiales y por lo tanto no fiables. Además, la autenticación parece ser difícil.

  3. Spinn3r - cuesta mucho dinero

  4. Spidering la internet archive en el sitio de la alimentación - Las porciones de complejidad, cobertura irregular, sólo es útil como último recurso

  5. Yahoo! Feed API o Yahoo! Search BOSS - El primero se parece más a un agregador, lo que significa que necesitaría un registro diferente para cada feed y el segundo debería dar más acceso a los datos de Yahoo, pero no puedo encontrar ninguna mención de los feeds.

  6. (gracias a Lou Franco) Bloglines Sync API - Además del problema de necesitar una cuenta y estar diseñado más como un agregador, no tiene forma de agregar feeds a la cuenta. Así que no hay recuperación de fuentes arbitrarias. Primero debe agregarlos manualmente a través del lector.

  7. Otros motores de búsqueda/búsqueda de blogs/lo que sea?

Este es un problema muy irritante como estamos hablando de información semántica que fue una vez allí, sigue siendo (por lo general) válida, sin embargo, es difícil de acceder de forma fiable, libre y sin límites. ¿Alguien sabe alguna fuente alternativa para la bondad de entrada de alimento?

Respuesta

1

La mejor respuesta que he encontrado hasta ahora es esta: la API no oficial de Google Reader resulta tener un punto de acceso público para sus feeds, lo que significa que no se necesita autenticación. El uso es el siguiente:?.

http://www.google.com/reader/public/atom/feed/ {uri su alimentación aquí} n = 1000

reemplazar el texto en los squigglies (incluyendo los propios squigglies) con la alimentación URI está interesado en obtener más información sobre la argumentos precisos se pueden encontrar aquí:

http://blog.martindoms.com/2009/10/16/using-the-google-reader-api-part-2/

pero recuerde que debe utilizar el/public/url si no quiere meterse con la autenticación

1

Bloglines tiene una API para sincronizar cuentas

http://www.bloglines.com/services/api/sync

Hay que hacer una cuenta, suscribirse a la fuente que desea descargar, pero entonces usted puede descargar en base a la fecha, lo que puede ser la forma en el pasado. No estoy seguro de los términos.

Cuestiones relacionadas