2011-03-09 12 views
82

Soy un cliente de Amazon RDS y estoy experimentando picos de latencia diaria de escritura RDS de Amazon, que corresponden aproximadamente a la ventana de la copia de seguridad. También veré picos al final de una instantánea (por ejemplo: ejecutar una instantánea tarda aproximadamente 1 hora, y en los últimos 5 minutos, escribir picos de latencia). Estoy ejecutando una implementación multi-AZ m1.large.¿Cómo funciona realmente la copia de seguridad/instantánea de Amazon RDS?

¿Hay alguien en Stack que pueda explicar cómo funciona la copia de seguridad de Amazon RDS en en realidad? He leído los documentos de Amazon RDS, y hasta donde sé, Amazon RDS no se comporta de acuerdo con las especificaciones. Específicamente, estas operaciones de copia de seguridad/instantáneas deberían estar afectando mi réplica y, por lo tanto, no causarán ningún impacto en el tiempo de inactividad o el rendimiento, o así lo pensé.

puedo destilar mi problema en seis preguntas:

  • lo que técnicamente se sucedan durante una instantánea y una copia de seguridad, y en qué se diferencian? (Si responde esta pregunta, dígame si puede confirmar empíricamente su respuesta, o simplemente me está citando documentación).
  • ¿Se espera un aumento en la latencia de escritura durante la ventana de copia de seguridad en una implementación multi-AZ?
  • ¿Se espera un aumento en la latencia de escritura al final de una instantánea en una implementación multi-AZ?
  • ¿Mi pico de latencia de escritura sería incluso mayor si no fuera multi-AZ?
  • Arquitectónicamente, ¿podría evitar estos picos de latencia de escritura si lanzo mi propia base de datos ejecutándose en dos instancias de m1.large EC2?
  • ¿Hay alguna configuración que pueda usar que evite estos picos de latencia de escritura mientras sigo alojando mi base de datos con RDS, o estoy efectivamente a merced de Amazon?

Pregunta de bonificación: ¿dónde y cómo aloja su base de datos mysql?

Puedo decir que, en general, estoy contento con RDS, excepto por estos problemas diarios de latencia de escritura. Me encanta el monitoreo integrado de la base de datos y fue bastante simple de configurar y poner en marcha.

Gracias!

amazon RDS write latency

Respuesta

70

También llevamos a cabo varios casos RDS, además de MySQL en algunas máquinas que manejamos nosotros mismos. No puedo comentar específicamente, ya que no soy un ingeniero de Amazon, pero varias cosas que he aprendido que podrían explicar lo que está viendo:

  • Aunque Amazon no comparte detalla el backend 100%, Sospechamos fuertemente que están usando su sistema EBS para respaldar las bases de datos RDS.

  • Este artículo ayuda a explicar las limitaciones de EBS y funcionalidad instantánea http://blog.rightscale.com/2008/08/20/amazon-ebs-explained/ Una vez más, aunque no es explícita, tendría sentido para Amazon a utilizar esta infraestructura para proporcionar servicios RDS.

  • Normalmente, una copia de seguridad de MySQL, a diferencia de una instantánea, implica el uso de una herramienta como mysqldump para crear un archivo de instrucciones SQL que luego reproducirá la base de datos. La base de datos no necesita estar congelada para hacer esto. Con un back-end de EBS, la mejor práctica es congelar la base de datos (pausar todas las transacciones) mientras realiza una instantánea para evitar daños en los datos.

  • Los picos que está viendo en los extremos de la ventana de copia de seguridad. Si Amazon hace una pausa en la replicación durante la instantánea de su réplica, la réplica debería "ponerse al día" en las transacciones cuando se complete la instantánea. Esto causaría un pico de latencia.

  • La replicación en una implementación multi-AZ es inherentemente más lenta que una única implementación de AZ. El precio que paga por una mejor redundancia.

+1

Gran respuesta, +1. – ceejayoz

+7

Puedo confirmar que Amazon RDS está utilizando EBS como la tienda de respaldo para sus bases de datos RDS. Los gráficos de Latencia de lectura y Latencia de escritura en RDS Cloudwatch describen eficazmente una instancia de EBS. Gracias por esta respuesta, tiene sentido. – esilver

+1

Amazon comparte más detalles sobre su interrupción post mortem aquí http://aws.amazon.com/message/65648/ – Joshua

Cuestiones relacionadas