Bueno, dado que sus hilos van a estar enlazados, la buena noticia es que ambos hilos Ruby 1.8 y 1.9 funcionarán para esto. Ruby 1.8 usa "hilos de espacio de usuario", lo que significa que no se crean nuevos hilos de sistema operativo cuando se crean nuevos hilos en Ruby. Esto es malo para la multitarea de CPU, ya que solo un subproceso de Ruby se está ejecutando a la vez, pero es bueno para la multitarea de IO. Ruby 1.9 usa hilos reales, y será bueno para cualquiera.
La cantidad de hilos que puede crear realmente depende de su sistema. Por supuesto, existen límites prácticos, pero es probable que no quiera acercarse a ellos. En primer lugar, a menos que los servidores que está descargando sean muy lentos y su conexión sea muy rápida, solo unos pocos hilos saturarán su conexión a Internet. Además, si atrapa muchas páginas de un solo servidor, lanzar 500 solicitudes a la vez desde 500 hilos tampoco servirá de nada.
Comenzaría bastante pequeño: 10 o 20 hilos corriendo a la vez. Aumente o disminuya esto dependiendo de la carga del servidor, su ancho de banda, etc. También existe el problema de las conexiones concurrentes a la base de datos MySQL. Dependiendo de cómo estén configuradas sus tablas y de su tamaño, intentar insertar demasiados datos al mismo tiempo no va a funcionar muy bien.
¡puedes 'ruin' bastantes! ;) –
arregló eso, gracias! no revisó el título: O – loosecannon