Quiero iniciar un clúster de amazon EC2 para usar un back-end para el paquete foreach
en R. Lo ideal es que pueda hacerlo desde la línea de comando en R en mi máquina local, enviando los datos y comandos relevantes de la sesión R local al clúster remoto.La manera más fácil de activar un clúster de Amazon EC2 para utilizarlo como un servidor anterior
Sé que el paquete AWS ayudará con esta tarea, pero realmente no sé qué hacer después de ejecutar el comando . Segue también me proporciona una parte del camino, pero no es un backend para foreach
, parece que no admite AMI personalizados, y actualmente no admite Windows. También está el paquete deathstar, que no he explorado en profundidad.
¿Alguien más ha encontrado una solución a este problema?
doRedis es en realidad lo que tenía en mente cuando escribí esta pregunta. Me imagino un escenario relativamente simple: creas un AMI "trabajador" personalizado que, al arrancar, inicia R, crea n trabajadores doRedis y hace que esos trabajadores se unan a una cola redis en un DNS que posees (como desde dyndns). Luego, necesita un script R en su máquina local que apunte su DNS a su máquina local, inicie doRedis usando su cola, inicie la máquina n worker, distribuya algunos cálculos en esas máquinas y luego apague esas máquinas. O simplemente puedo esperar y esperar que alguien escriba 'doEC2' pronto ... – Zach
yup, lo que describes es lo que he estado agitando mentalmente. No lo he construido aún :) –
Deberías echarle un vistazo al paquete deathstar que agregué a mi pregunta. Utiliza ZMQ en lugar de redis, pero parece bastante cercano a lo que estamos buscando. – Zach