2008-11-12 29 views

Respuesta

8

Para algo como Twitter, se ahorrará un montón de tiempo al no reinventar la rueda. Pruebe una biblioteca como python-twitter. De esta forma, puede escribir su secuencia de comandos, o incluso una aplicación completa, que interactúa con Twitter, y no tiene que preocuparse por los detalles de la implementación.

Si desea rodar su propia biblioteca de interfaz, vas a tener que familiarizarse con urllib y dependiendo de qué formato que proporcionan resultados, ya sea lxml (o algún otro analizador XML) o simplejson.

+1

+1 Simplejson es un componente vital aquí. –

+2

urllib, lxml y simplejson suenan como las herramientas que necesito. ¡Gracias! –

+0

@Rich: si le resultó útil, entonces sabrá lo que debe hacer ... wink wink empujar con el dedo pequeño –

2

Python tiene un módulo httplib muy agradable, así como un módulo de url que en conjunto probablemente lograr la mayor parte de lo que necesita (al menos en lo que respecta a la funcionalidad de wget).

4

Recomiendo sinceramente mechanize para python. Es exactamente un navegador web programable que puedes usar desde python, ¡que maneja formularios y cookies también! Hace que cualquier tipo de sitio se ralentice.

Eche un vistazo a los ejemplos en ese enlace para ver lo que puede hacer.

+0

Mecanizar es ideal para situaciones en las que NO TIENE una API, pero la OP especifica un sitio como Twitter, que tiene una API, por lo que urllib2 suele ser el camino a seguir. – bouvard

+0

ah, no entendí exactamente lo que quería decir con "tiene una API", pero quiere decir que tiene una forma extensa de interactuar solo a través de las URL. en ese caso, sí, urllib2 debería ser suficiente. – Claudiu

+0

"Hace que cualquier tipo de sitio se rastree rápido", excepto cuando el sitio está configurando valores de cookies a través de JavaScript, y confiando en ellos, como estoy avergonzado. –

0

Si está acostumbrado a tratar con cURL, considere PycURL.

Cuestiones relacionadas