Cómo desplegar una araña Scrapy en la nube de Heroku

Desarrollé algunas arañas en scrapy & Quiero probar las de la nube de Heroku. ¿Alguien tiene alguna idea sobre cómo desplegar una araña Scrapy en la nube de Heroku?Cómo desplegar una araña Scrapy en la nube de Heroku

Fuente

2012-10-08 Aniruddha

scrapy-heroku fue escrito específicamente para este propósito: http: //pypi.p ython.org/pypi/scrapy-heroku –

Sí, es bastante fácil de implementar y ejecutar su araña Scrapy en Heroku.

Éstos son los pasos con un proyecto real Scrapy como ejemplo:

Clon del proyecto (tenga en cuenta que debe tener un archivo requirements.txt de Heroku a lo reconoce como un proyecto de Python):

git clone https://github.com/scrapinghub/testspiders.git
Agregue cffi al archivo requirement.txt (por ejemplo, cffi == 1.1.0).
Crear la aplicación Heroku (esto añadirá un nuevo mando a distancia heroku GIT):

heroku create
implementar el proyecto (esto tardará un tiempo la primera vez, cuando la bala se construye):

git push heroku master
Ejecutar su araña:

heroku run scrapy crawl followall

Algunas notas:

disco Heroku es efímero. Si desea almacenar los datos raspados en un lugar persistente, puede usar un S3 feed export (agregando -o s3://mybucket/items.jl) o usar un complemento (como MongoHQ o Redis To Go) y escribir una tubería para almacenar sus artículos allí
Sería Genial para ejecutar un servidor Scrapyd en Heroku, pero actualmente no es posible porque el módulo sqlite3 (que requiere Scrapyd) no funciona en Heroku
Si desea una solución más sofisticada para implementar sus arañas Scrapy, considere configurar su propia araña Scrapyd server o usando un servicio alojado como Scrapy Cloud

Fuente

2012-10-18 21:58:44

Creo que 'heroku run' inicia un One-Off Dyno que dará como resultado un costo de más dinero. ¿Es esta la única opción? – elgehelge

@Helge one dynos no cuestan más por minuto que los dynos estándar. –

¡Puedes usar scrapy-heroku para ejecutar un servidor de Scrapyd en heroku! Ha estado funcionando bien para mí. https://github.com/dmclain/scrapy-heroku – arctelix

Cómo desplegar una araña Scrapy en la nube de Heroku

Respuesta

Cuestiones relacionadas