Estoy raspando un sitio de fútbol y la araña (una sola araña) obtiene varios tipos de elementos de las páginas del sitio: equipo, partido, club, etc. Estoy tratando de utilizar el CSVItemExporter para almacenar estos elementos en archivos CSV separados, teams.csv, matches.csv, etc. clubs.csvCómo puedo exportar artículos a archivos csv por artículo
no estoy seguro de cuál es la forma correcta de hacer esto. La única forma que he pensado hasta ahora es crear mi propia canalización personalizada como en el ejemplo http://doc.scrapy.org/en/0.14/topics/exporters.html y allí abrir todos los archivos csv necesarios en el método spider_opened, es decir, crear un exportador csv para cada archivo csv y en el código process_item put a averiguar qué tipo de elemento es el parámetro "artículo" y luego enviarlo al objeto exportador correspondiente.
De todos modos, no he encontrado ningún ejemplo de manejo de varios archivos csv (por tipo de elemento) en scrapy así que me preocupa que lo esté usando de una manera que no debe ser utilizada. (esta es mi primera experiencia con Scrapy).
diomedes
Ok, después de escribir el MultiCSVItemPipeline me siento mejor :-). Compruebo como sugirió la clase de elemento para descubrir dónde va el artículo. Me estoy dando una auto respuesta para mostrar el código para cualquier persona que tenga la misma pregunta. – Diomedes