Por lo tanto, el escenario es el siguiente:¿Es mejor tener muchos pequeños contenedores de blobs de almacenamiento de Azure (cada uno con algunos blobs) o un contenedor realmente grande con toneladas de blobs?
Tengo varias instancias de un servicio web que escribe un bloque de datos en Azure Storage. Necesito poder agrupar blobs en un contenedor (o directorio virtual) dependiendo de cuándo fue recibido. De vez en cuando (todos los días en el peor), los blobs más antiguos se procesan y luego se eliminan.
que tienen dos opciones:
Opción 1
hago un contenedor llamado "manchas" (por ejemplo) y luego almacenar todos los blogs en ese contenedor. Cada blob usará un nombre de estilo de directorio con el nombre del directorio como la hora en que se recibió (por ejemplo, "hr0min0/data.bin", "hr0min0/data2.bin", "hr0min30/data3.bin", "hr1min45/data.bin"). ", ...," hr23min0/dataN.bin ", etc. - un nuevo directorio cada X minutos). Lo que procesa estos blobs procesará hr0min0 blobs primero, luego hr0minX y así sucesivamente (y los blobs aún se escriben cuando se procesan).
Opción 2
Tengo muchos contenedores cada uno con un nombre basado en el tiempo de llegada (por lo que primero será un contenedor llamado blobs_hr0min0 entonces blobs_hr0minX, etc) y todas las manchas en el contenedor son aquellas manchas que llegó a la hora indicada. Lo que procesa estos blogs procesará un contenedor a la vez.
Entonces mi pregunta es, ¿qué opción es mejor? ¿La opción 2 me da una mejor paralelización (ya que los contenedores pueden estar en servidores diferentes) o es mejor la opción 1 porque muchos contenedores pueden causar otros problemas desconocidos?
Wow - buen momento ... :) – dunnry
¡Gracias, esto hace que la decisión sea clara y fácil! – encee
Por favor, ¿hay alguna necesidad de mantener el nombre del blob tan corto como sea posible? (Tengo "un contenedor realmente grande con toneladas de blobs", opción 1 en la pregunta.) – nmit026