EC2 proporciona un mecanismo escalable a pedido muy conveniente para ejecutar procesos distribuibles (paralelos) y S3 proporciona un servicio de almacenamiento confiable.Cómo establecer una conexión rápida y confiable de S3 a EC2
Estaba tratando de emplear nodos EC2 para un proceso de análisis ETL &, este proceso necesita una gran cantidad de datos (100GB - 1TB) ingeridos muy rápidamente (y varias veces en un día) y recursos informáticos adecuados para estar disponibles para una corta duración.
El diseño encima de las necesidades
- Un gran ancho de banda de conexión/rápida entre S3 y EC2.
- S3 -> La conexión EC2 también debe ser confiable ya que la programación de los datos de arranque, bombeo, ejecución y terminación debe realizarse lo antes posible no solo para ahorrar costos, sino también porque los SLA están involucrados.
Pero aún
- El único medio de la extracción de datos del estado S3 parece ser a través de http y por lo tanto se ve limitada por los anchos de banda de descarga de los nodos EC2.
- Además, la ingestión de datos se realiza a través de Internet y, por lo tanto, puede no ser lo suficientemente confiable para fines estrictos de programación que requieren un almacenamiento intermedio adecuado entre trabajos.
En una configuración de centro de datos privada, se puede configurar una línea dedicada más rápida (digamos 10 Gbps) entre el almacenamiento y los nodos físicos.
¿Hay alguna alternativa posible/opciones de servicios en caso de aws que pueden abordar los requisitos anteriores.
Amazon havent publicado nada sobre esto en su sitio web, ¿hay alguna otra fuente para obtener esta información? ¿Hay un modelo de fijación de precios diferente que permita flexibilidad para elegir velocidades de transferencia. – sandeepkunkunuru
No existe tal información porque ** varía **.La única forma de aumentar la velocidad de red de AWS es mediante el uso de las instancias de clúster, que obtienen conexiones de 10 Gigabits entre servidores, o mediante el uso de instancias dedicadas costosas de AWS (http://aws.amazon.com/dedicated-instances/) para controlar los efectos. de otras personas en tus servidores. – ceejayoz