No tengo un problema de código específico No estoy seguro de cómo abordar el siguiente problema logísticamente con el marco de Scrapy:Scrapy: ¿Seguir el enlace para obtener datos adicionales del ítem?
La estructura de los datos que quiero raspar suele ser una fila de tabla para cada elemento . Muy sencillo, ¿verdad?
En última instancia quiero raspar la Título, Fecha de vencimiento, y detalles para cada fila. Título y Fecha de vencimiento están disponibles de inmediato en la página ...
pero los detalles mismos no están en la mesa -, sino más bien, un enlace a la página que contiene los detalles (si es que doesn 't tiene sentido aquí es una tabla):
|-------------------------------------------------|
| Title | Due Date |
|-------------------------------------------------|
| Job Title (Clickable Link) | 1/1/2012 |
| Other Job (Link) | 3/2/2012 |
|--------------------------------|----------------|
me temo que todavía no sé cómo pasar logísticamente el artículo alrededor con devoluciones de llamada y peticiones, incluso después de leer a través de la sección deCrawlSpider del Scrapy documentación.
¿Hay un código básico ejemplo en alguna parte? – fortuneRice
@fortuneRice, no estoy seguro si los ejemplos están actualizados: http://stackoverflow.com/questions/11150053 http://stackoverflow.com/questions/13910357/how-can-i-use-multiple-requests-and -pass-items-in-between-them-in-scrapy-python/13911764 # 13911764 – warvariuc
esta es la parte relevante de los documentos: http://doc.scrapy.org/en/latest/topics/spiders.html – tback