en una línea similar a esta pregunta: stackoverflow: running-multiple-spiders-in-scrapyarañas edificio Scrapy en mi propio programa, no quiero llamar scrapy de línea de comandos)
Me pregunto, ¿puedo ejecutar un proyecto completo desde dentro scrapy otro programa python? Solo digamos que quería construir un programa completo que requiriera raspar varios sitios diferentes, y construyo proyectos completos de raspado para cada sitio.
en lugar de ejecutar desde la línea de comandos como uno de, quiero ejecutar estas arañas y obtener la información de ellos.
Puedo usar mongoDB en python ok, y ya puedo crear proyectos de scrapy que contengan arañas, pero ahora solo estoy fusionando todo en una sola aplicación.
Quiero ejecutar la aplicación una vez, y tienen la capacidad de controlar múltiples arañas de mi propio programa
Por qué hacer esto? bueno, esta aplicación también puede conectarse a otros sitios usando una API y necesita comparar los resultados del sitio API con el sitio raspado en tiempo real. No quiero tener que llamar a scrapy desde la línea de comandos, todo está destinado a ser autónomo.
(He estado haciendo muchas preguntas sobre el raspado hace poco, porque estoy tratando de encontrar la solución adecuada para construir en)
Gracias :)