2008-08-14 8 views
6

Por lo tanto, la respuesta probablemente debería presentarse en niveles para el tamaño de la aplicación, pero me pregunto acerca de la experiencia de las personas al elegir dónde deberían residir las unidades de disco utilizadas por la base de datos.¿Cuál es el mejor dispositivo de almacenamiento de base de datos?

Estas son algunas de las opciones:

  • JBOD - (sólo un montón de discos) discos internos pasados ​​de moda - rápido pero no muy ampliable
  • NAS - lento pero barato y ampliable, probablemente el mejor para copias de seguridad de
  • DAS - Un compromiso decente, pero generalmente accesible desde sólo una o dos máquinas
  • SAN - Caro, pero muy bueno

¿Cuánto debe preocuparse por elegir un disco de 15k en vez de 10k o 7200RPM?

¿Cuál es su nivel de RAID favorito?

Respuesta

0

Solo para comenzar, estoy usando un dispositivo de almacenamiento de conexión directa Dell MD3000, conectado a través de tarjetas HBA redundantes. Tiene unidades 9x146Gb 15K, dispuestas en 4 matrices RAID 1 con 1 repuesto en espera. La huella total de datos se aproxima a 200 Gb. No estoy muy contento con el rendimiento de IO, pero está haciendo el trabajo.

0

Tenemos un clúster de base de datos conectado a un NAS, también con HBA redundante. Las unidades NAS son RAID-10. Desde nuestro servidor de almacenamiento, para las bases de datos, cuanto mayor sea el RPM, mejor.

1

El mayor aumento de rendimiento que puede obtener es mediante la partición de tablas/índices en diferentes discos. El primer paso sería poner índices en un disco y datos en otro. Después de esto, debe considerar qué tablas/índices se usan juntos y colocarlos en discos separados ("ejes") cuando sea posible.

+0

> El aumento de rendimiento más grande que puede obtener es mediante la partición de tablas/índices en diferentes discos. El primer paso sería poner índices en un disco y datos en otro. Después de esto, debe considerar qué tablas/índices se usan juntos y colocarlos en discos separados ("ejes") cuando sea posible. Estoy totalmente de acuerdo con esto. Pero ... Hace un tiempo vi cierto comportamiento con mi DAS que todavía me desconcierta. Tuvimos una tarjeta HBA que se dañó y corrompió la base de datos (las copias de seguridad de otro dispositivo también fallaron ... pesadilla) y me forzaron a tirar todo en la unidad C del servidor de base de datos hasta el –

+0

Si hubiera estado en RAID 5 o 6, el rendimiento podría haber venido de no hacer más escrituras de banda parcial. RAID 10 es a menudo mejor. A veces, la base de datos se puede ajustar para escribir en tamaños de bloque de banda RAID, también. –

2

Aunque el DAS basado en SAS es más rápido para un solo servidor de bases de datos (idealmente con discos SFF de 15krpm de 2,5 pulgadas en una configuración RAID 10) para la mayoría de los sistemas, se pierden muchas de las ventajas que puede ofrecer una SAN. Por esa razón, siempre construiría bases de datos con adaptadores FC dobles (enlaces de fibra de 4 u 8 Gbps) en conmutadores dobles de SAN, conectados a una matriz SAN de doble controlador. Este escenario no solo será muy rápido, sino que también abrirá las opciones para utilizar las diversas técnicas de instantáneas que estos cuadros tienen para ofrecer. Estos pueden permitir la replicación de bases de datos en vivo entre los sitios para DR, la restauración instantánea de la base de datos y una excelente expansión/reducción de la capacidad sin impacto en los servidores mismos. Espero que esto ayude, avíseme si puedo agregar más.

0

Eric, tal vez podría ver alguna forma de SAN en el futuro cercano, incluso los sistemas más baratos ofrecen algún tipo de sistema de instantáneas. En el escenario que mencionaste, esto te hubiera permitido recuperar una instantánea anterior de tus datos en instantes. La caja HP ​​MSA2000fc es bastante económica y ofrece algunos de estos servicios, al igual que muchos otros fabricantes, por supuesto.

2

Eso dependería del uso que le esté dando a las unidades. Algunos ejemplos de aplicaciones podrían ser:

  • de almacenamiento robusto de una modesta cantidad de datos con tráfico moderado (como una red doméstica con varios por^archivos H^H^Hmedia encima): Un par duplicado (RAID 1) de discos que están separados del disco del sistema de la máquina en la que están instalados. Esto le permitirá reconstruir la máquina o realizar una cirugía mayor sin afectar el volumen de datos. RAID-1 significa que los datos sobrevivirán a la falla de un solo disco.
  • Un sistema de edición de video que necesita transmisión rápida pero no necesariamente 100% de confiabilidad: un RAID-0 de conexión directa (rayas) en discos de canal de fibra con firmware 'V' (un seagate pero hacen la mayoría de esas partes). El canal de fibra es un protocolo basado en paquetes, mientras que con SCSI dos dispositivos reservan todo el bus. FC funciona mejor bajo carga.
  • Aplicación Trnsactional: inicia sesión en un par reflejado y datos en uno o más volúmenes RAID-5/6, RAID-10 o RAID-50/60. En una SAN o en cualquier configuración de controlador con almacenamiento en memoria caché respaldado por batería, el controlador puede optimizar las escrituras en el disco. Los registros de DB son principalmente acceso secuencial, mientras que los volúmenes de datos son en su mayoría de acceso aleatorio. La actividad de búsqueda aleatoria perturbará la actividad de registro, por lo que obtendrá un aumento en el rendimiento al mantener los discos de registro relativamente tranquilos y libres de tráfico competidor.
  • Tabla de hechos del almacén de datos grande: una serie de pares duplicados (RAID 1) en JBOD con tantos canales de host en el servidor como pueda. Distribuya las particiones de la tabla de hechos a través de los pares duplicados. Los discos rayados con la configuración típica de firmware de matriz a menudo solo le darán una (digamos) banda de 64k por revolución del disco, que puede llegar a 5 o 10MB/seg por disco en una unidad de 10K. Las cargas de trabajo DW tienen un patrón de acceso a datos de transmisión más que una aplicación transaccional. El uso de los pares duplicados significa que los discos pueden transmitir datos potencialmente en algo más parecido a su velocidad máxima de transferencia de datos. Esto puede ser un orden de magnitud más rápido.
Cuestiones relacionadas