Estaba buscando escribir un pequeño rastreador web en python. Estaba comenzando a investigar cómo escribirlo como un script multiproceso, un grupo de descarga de subprocesos y un resultado de procesamiento de agrupación. Debido a la GIL, ¿en realidad haría una descarga simultánea? ¿Cómo afecta el GIL a un rastreador web? ¿Cada hilo seleccionará algunos datos del zócalo, luego pasará al siguiente, dejará que recoja algunos datos del zócalo, etc.?¿Un rastreador multiproceso en Python realmente acelera las cosas?
Básicamente lo que estoy pidiendo está haciendo un rastreador multi-roscado en Python realmente me va a comprar mucho el rendimiento vs solo subproceso?
gracias!
No utilice Twisted. Usa gevent Utiliza asincronización debajo de las cubiertas, pero le permite codificar de forma directa y con varios subprocesos. –