Simplemente quiero crear un script automático que pueda ejecutarse (preferiblemente) en un servidor web, y simplemente 'haga clic' en un objeto de una página web. Soy nuevo en Python o en cualquier idioma que se use, así que pensé que iría aquí para preguntar por dónde empezar. Esto puede parecer como si quisiera que el guión estafase anuncios o hiciera algo ilegal, pero es simplemente para interactuar con otro sitio web.¿Por dónde empiezo con un bot web?
Respuesta
Recomendaría la biblioteca Python mechanize. Está diseñado para actuar como un navegador simulado. Lo he usado para manejar varias interfaces web desde script.
Probablemente comenzaría con Twill - puede utilizar su lenguaje de scripting o Python API.
No tiene que ser Python, lo he visto hecho en PHP y Perl, y probablemente puedas hacerlo en muchos otros idiomas. El enfoque general es:
1) Le da a su aplicación una URL y hace una solicitud HTTP a esa URL. Creo que he visto esto hecho con php/wget. Probablemente muchas otras formas de hacerlo.
2) Escanee la respuesta HTTP para otras URL que desee "hacer clic" (realmente, enviándoles solicitudes HTTP), y luego envíe las solicitudes a las mismas. El análisis de los enlaces generalmente requiere una cierta comprensión de las expresiones regulares (si no está familiarizado con las expresiones regulares, repasarlas, es algo importante;)).
- 1. ¿Por dónde empiezo con rJava?
- 2. Aplicación web Clojure: ¿dónde empiezo?
- 3. ¿Por dónde empiezo con Zend Framework?
- 4. ¿Por dónde empiezo con la informática distribuida?
- 5. ¿Por dónde empiezo con la Programación Orientada a Aspectos?
- 6. ¿E-commerce de Django realmente básico? ¿Por dónde empiezo?
- 7. Programación de juegos en C, ¿dónde empiezo?
- 8. ¿Dónde comenzaré haciendo un raspador o un bot usando python?
- 9. Desarrollo de licencias en C#: ¿dónde empiezo?
- 10. Cómo crear un bot IM con C#
- 11. ¿Por dónde empiezo con la programación de VBA y macros en Word 2007?
- 12. ¿Por dónde empiezo a hacer un hack de entrada de Linux?
- 13. ¿Cómo empiezo a construir aplicaciones web con Java?
- 14. ¿Cómo empiezo a desarrollar para una web con Scala?
- 15. Prevención de ataque de inyección SQL: dónde empiezo
- 16. ASP.NET MVC y patrón de vista modelo-controlador: ¿por dónde empiezo?
- 17. ¿Por dónde empiezo a aprender sobre el procesamiento de imágenes y el reconocimiento de objetos?
- 18. Creando un bot de IM
- 19. ¿Por dónde empezar con el desarrollo web de teléfonos inteligentes?
- 20. ¿Cómo empiezo con zc.buildout y Distribute?
- 21. ¿Cómo empiezo a aprender Assembly
- 22. ¿Cómo empiezo con Sub versión de trabajo + Delphi?
- 23. Servicios web de Amazon: por dónde empezar
- 24. ¿Por dónde empiezo a investigar mi proceso de Java que no terminará?
- 25. Creando un bot de IRC en Java
- 26. Bot para Unreal Tournament
- 27. Desarrollo de aplicaciones web para iPhone en ASP.NET: ¿por dónde empezar?
- 28. Programmatic Bot Detection
- 29. ¿Por qué Yahoo Indexing Bot es considerado como "malvado"?
- 30. Extraña excepción en Rails 3 causada por google bot (o algo que pretende ser un googlebot)
Votación para cerrar como demasiado amplia/herramienta rec. –