Después de trabajar en varias aplicaciones GAE, algunas de las cuales se están utilizando para producción, he llegado a la conclusión de que en esta plataforma, realizar copias de seguridad de sus datos de producción es lo suficientemente lento y costoso para que podamos hacer la transición a otra tecnología basada en la nube apilar.Google App Engine: copia de seguridad y restauración prohibitivamente lentas y costosas
En una de nuestras aplicaciones de producción, tenemos alrededor de un millón de entidades con un tamaño promedio por entidad de 1 KB. Entonces, el tamaño total de los datos es alrededor de un GB, lo que no debería ser un gran problema, ¿verdad? Aquí está la salida de la herramienta bulkloader después de ir a buscar las entidades del motor de aplicación con las opciones por defecto:
[INFO] 948212 entidades (608342497 bytes) transferidos en 47722.7 segundos
que es casi 13 horas Entonces, si quisiéramos configurar un sistema de respaldo por hora para nuestros datos de producción, eso sería más que imposible con el conjunto de herramientas GAE actual.
El costo es otra historia. Intenté usar el administrador del almacén de datos para copiar entidades a una aplicación diferente que pensé que podríamos usar para la copia de seguridad. Primero fijé el presupuesto en $ 2 por día, que rápidamente se agotó en alrededor de 5000 entidades, luego aumenté el presupuesto a $ 10 por día, que se agotó nuevamente sin estar cerca de replicar el millón de entidades.
Evidentemente, no tengo la intención de gastar $ 100 cada vez que necesito respaldar mis datos de 1 GB ni tampoco quiero esperar durante horas (o incluso días) solo para que mis datos estén respaldados. Entonces, o no sé algo o Google App Engine es actualmente una forma poco práctica de escribir aplicaciones escalables de calidad de producción de tamaño significativo que se pueden respaldar y restaurar fácilmente.
¿Existe una manera rápida y rentable de hacer una copia de seguridad de sus datos desde una aplicación GAE?
GCS de ninguna manera resuelve el problema de la copia de seguridad de su AppEngine Datastore. Todavía sería necesario consultar toda la base de datos y luego enviarla a GCS. –
Puede usar MapReduce como sugirió Nick Johnson aquí http://stackoverflow.com/questions/7747453/back-up-appengine-database-google-cloud-storage. –
Entonces, ¿GCS es la solución aceptada para el problema del costo, o hay algo más disponible? – Sabuncu