2011-10-15 14 views
6

¿Alguien puede decirme la diferencia entre una base de datos simple y un depósito de datos en términos de implementación?diferencia de almacén de datos y base de datos en la implementación

sé que el almacén de datos se utiliza para el análisis en lugar de mantener registro, pero no entiendo cómo son estructuralmente diferentes que

En sencilla base de datos tenemos mesas y así, en un almacén de datos. ¿Cómo podemos crear un almacén de datos a partir de una base de datos simple?

En ambos casos tenemos consultas, entonces, ¿cómo son diferentes para cada una de ellas?

+0

posible duplicado de [¿Cuál es la diferencia entre una base de datos y un almacén de datos?] (Http://stackoverflow.com/questions/3419353/what-is-the-difference-between-a- database-and-a-data-warehouse) – Pondlife

Respuesta

9

Las diferencias están en la aplicación, que es la representación (estructura) de los datos de las tablas.

Una base de datos simple normalmente se estructura en tablas normalizadas para minimizar la redundancia y optimizar las operaciones de escritura en la tabla. Esto se puede lograr dividiendo las tablas grandes en tablas más pequeñas y menos redundantes, de modo que los datos del mismo tipo estén aislados en un solo lugar para que las adiciones, eliminaciones y modificaciones de un campo se puedan hacer en una sola tabla. Las tablas más pequeñas se conectan juntas a través de relaciones definidas entre ellas (esto se hace mediante claves externas), lo que da como resultado muchas uniones entre tablas al recuperar los datos.

Por otro lado, un datawarehouse está estructurado solo para operaciones de lectura, por lo que un datawarehouse acepta algún nivel de redundancia en los datos, ya que esto hace que la lectura sea más rápida. En un almacén de datos, los datos generalmente se estructuran en lo que se denomina un enfoque de Starschema mediante el uso de modelos dimensionales. Eso significa que tiene 1 gran tabla (Facttable) con todos los registros y medidas relevantes (cantidad de ventas de fx en $), y luego muchas tablas menores (llamadas tablas de dimensiones) que describen los valores en la tabla de hechos. Dimensiontables podría ser algo como Fecha, SalesCountry, SalesPerson, Product etc. que todos describen el importe de ventas de la tabla de hechos. Las tablas de dimensiones se relacionan luego con la tabla de hechos con claves foráneas, creando así la figura de estrella con la tabla de hechos en el medio y todas las tablas de dimensiones a su alrededor en un círculo que la enlaza.

NB: Esta es una introducción muy simple, y por supuesto debe consultar la documentación de un datawarehouse para leer más detalles. Busque libros de Ralph Kimball y Bill Inmon, ellos son los gurús dentro del campo del datawarehouse.

1

En esencia, la forma en que los datos y las tablas se organizan - y mucho más ...

Leer

  • Bill Inmon "La construcción de almacén de datos"
  • Ralph Kimball "El kit de herramientas de Data Warehouse "
1

OLTP significa procesamiento de transacciones en línea.Los sistemas que se usan en cualquier sistema de reserva o en términos técnicos "OLTP, se refiere a una clase de sistemas que facilitan y administran aplicaciones orientadas a transacciones, típicamente para el procesamiento de transacciones de entrada y recuperación de datos"

Ahora llegan las siguientes preguntas Cuál es la diferencia entre OLTP y Data Warehouse?

Hay muchas diferencias entre los dos, por lo que aparecerá una lista de algunas de las diferencias importantes:

  • La diferencia más importante de todo es: OLTP es normalmente en 3NF (tercera forma normalizada) mientras que los datos El almacenamiento no está en 3NF. Por lo tanto, también podemos inferir que OLTP no tendrá ningún tipo de Redundancia de datos.

  • El almacén de datos se utiliza para almacenar meses y años de datos para respaldar el análisis histórico, mientras que los datos de la tienda del sistema OLTP duran algunas semanas o meses. Por lo tanto, los tamaños de DB también tienen una gran diferencia. OLTP usa 100MB - 100GB donde un Data Warehouse usa 100GB - pocos terabytes.

  • La estructura altamente normalizada de OLTP lo ayuda a optimizar las operaciones como ACTUALIZAR/INSERTAR/ELIMINAR, donde Data Warehouse tiene una estructura muy desnormalizada (Esquema de estrella) para optimizar el rendimiento de la consulta.

  • Los datos en Data Warehouse se actualizan regularmente por el proceso ETL y el usuario final no actualiza el almacén de datos directamente, mientras que en los sistemas OLTP los usuarios finales emiten sentencias de modificación de datos a la base de datos y el sistema OLTP está activo hasta la fecha.

Estas son algunas diferencias importantes entre OLTP y Data Warehouse.

Read more

Cuestiones relacionadas