2010-06-22 23 views
18

Un cliente me preguntó qué significa realmente el término "data warehouse".¿Qué es un almacén de datos?

Pensé en ETL, detalles del modelo de datos, diferencias con NoSQL, Clouds, DBMS "normal", MDM (Master Data Management) etc. pero no pude describir el término en pocas palabras. .. (De hecho, yo hablé un poco y lo dejé sin iluminación.)

¿Cómo se puede describir el "almacén de datos" en 1-3 (o un poco más) oraciones?

Respuesta

15

Para muchachos no técnicos lo mejor es describirlo como "Gran cantidad de datos almacenados en un sistema informático especializado. Los datos suelen estar relacionados con un dominio específico y todo el sistema está diseñado para ser rápido y optimizado para algunas tareas especiales Los datos almacenados en los almacenes de datos se utilizan principalmente para el análisis o en los procesos de toma de decisiones ".

No estoy seguro si esto es suficiente :) Hay muchas referencias a este tema en Internet, pero si alguien me pidiera una definición rápida, usaría algo similar a lo que escribí arriba.

5

De wiki:

Un almacén de datos es un repositorio de almacenados electrónicamente datos de una organización , diseñados para facilitar la presentación de informes y análisis 1.

Esta definición del almacén de datos se centra en el almacenamiento de datos. Sin embargo, el significa recuperar y analizar datos, extraer, transformar y cargar datos, y para administrar el diccionario de datos también son considerados componentes esenciales de un sistema de almacenamiento de datos . Muchas referencias al almacenamiento de datos usan este contexto más amplio. Por lo tanto, un definición ampliada de datos almacenamiento incluye negocio herramientas de inteligencia, herramientas para extraer, transformar y cargan datos en el repositorio , y herramientas para gestionar y recuperar metadatos.

4

Un almacén de datos es un intento de hacer que los sistemas dispares parecen ser homogénea, independientemente de la tecnología subyacente o mecanismo de almacenamiento.

Podría entrar en el "por qué" del almacenamiento de datos, pero esa es una pregunta diferente.

5

Al menos teóricamente, la idea de un depósito de datos es proporcionar una vista consolidada de los datos de una variedad de sistemas existentes, que generalmente se consideran poco prácticos para reescribir para consolidar los datos directamente. Por lo tanto, el almacén de datos recopila datos de esos sistemas existentes y proporciona (al menos la ilusión de) que todos los datos estén en un solo lugar, por lo que se puede consultar de una manera.

La intención principal es (generalmente) permitir la correlación entre los datos de los sistemas existentes. Por ejemplo, puede comparar cuánto tiempo pasó su vendedor con el cliente X (que está almacenado en un sistema) en cuánto compró el cliente X (almacenado en un segundo sistema) y qué tan feliz es el cliente X con lo que está recibiendo (almacenado, por supuesto, en un tercer sistema).

Desde un punto de vista práctico, a menudo significa que las ideas del cliente están en algún lugar entre mal definidas y completamente dementes. El costo y el cronograma son casi imposibles de adivinar, y una estimación sólida es claramente imposible. Ofrecer lo que realmente quiere es casi seguro imposible, y resolver algo que será útil va a tomar suficiente tiempo y trabajo, que su primer paso es hacer que lo que está haciendo suene lo suficientemente técnico como para que no tenga un corazón atacar cuando tenga una idea del costo y/o cronograma.

0

Desde un punto de vista práctico: las empresas cambian, los entornos cambian, lo que fue una pregunta importante ayer, puede no ser hoy y probablemente no sea mañana. Esto es especialmente cierto cuando se trata de preguntas a nivel de CEO.

Si no puede prever cuáles serán las preguntas, su única opción es proporcionar los medios para responder cualquier pregunta rápidamente. Eso es lo que los almacenes de datos intentan o pretenden hacer. De dónde provienen los datos, y de cuántos sistemas dispares, es inmaterial.

Muchos almacenes de datos fallan en la "respuesta a cualquier pregunta rápidamente" porque su tecnología requiere que convierta los datos brutos disponibles "al revés" (fabricación de cubos) para garantizar el "rápido". Y definir esos cubos restringe la variedad de preguntas que pueden ser respondidas.

2

Un depósito de datos es una base de datos, una carga de datos y un sistema de informes diseñado para agregar datos de múltiples fuentes y presentarlos de una manera que sea fácil de extraer e informar. Desde un punto de vista práctico, los beneficios de un proyecto de almacén de datos con éxito son:

  • La declaración de datos y financiera - almacenes de datos que sea fácil de trabajar con datos en su conjunto y obtener un análisis útil de ella, sobre todo cuando usted tiene 65537 o más filas de datos.

  • Seguridad de los datos: los datos se comportan bien y no tienen trampas para jugadores jóvenes. Los sistemas de informes ad-hoc pueden ser utilizados por usuarios inexpertos con bajo riesgo de producir resultados no válidos en los informes sin darse cuenta.

  • Transparencia: la empresa puede ver e identificar problemas con los datos en los sistemas subyacentes. Un almacén de datos puede ser una buena herramienta para impulsar el trabajo de calidad de datos.

  • Empoderamiento: las herramientas de generación de informes del usuario final deben ser compatibles con la mayoría de los requisitos de información de gestión con solo un conjunto mínimo que requiere la elaboración de un informe personalizado por parte de un especialista técnico.

2

beso ...

Un almacén de datos es un repositorio de datos relacionados con una determinada organización y sus actividades. Estos datos permitirán el análisis y la presentación de informes sobre el rendimiento de la organización en varias dimensiones pertinentes, como el tiempo, la estructura y los flujos de actividad. Estas dimensiones se pueden combinar y los resultados se pueden agregar a través de jerarquías relevantes.

-3

En términos simples ...

Un almacén de datos es una manera de controlar los artículos en un almacén real que contiene el lugar de control, acción, movimiento, informes, auditoría, nada de "objetos reales" en un " almacén real ".

Espero que sea más simple.

+0

Oh, no, me temo que no lo es. Lea algunas de las otras respuestas aquí para comprender el término "almacén de datos". –

+0

Oh Dios ... gracias señor. David. tu comentario hazme leer toda esta página. y no necesito reconstruir mi opinión sobre el almacén de datos. –

0

De lo que sé El almacén de datos no es más que una base de datos relacional que está diseñada para consulta y análisis. Por lo general, contiene datos de historial derivados de datos de transacción.

Según William Inmon, datos de definición de almacén es:

almacén de datos es una colección sujeto orientado, integrado, no volátil y variable en el tiempo de los datos en apoyo de las decisiones de gestión.

Y la definición anterior es lógico y perfecto si pensamos racionalmente y se puede entender de here

2

Wow, que estaba haciendo un poco de investigación. Esta es una muy buena respuesta que encontré:

Almacenamiento de datos ... es la versión reproducida de las transacciones de datos que están especialmente estructuralizadas y creadas para consultas, análisis e informes. En una definición muy simple, el almacenamiento de datos a largo plazo se refiere al proceso de recopilación de datos de manera sistemática que se almacenan de una manera organizada para que puedan ser accedidos y recuperados para su futura presentación de informes y análisis de documentos

Es de "Data Warehouse 100 Success Secrets" por Richard Martin

0

Un depósito de datos es una base de datos relacional diseñada para análisis de consultas y negocios en lugar de para el procesamiento de transacciones. Contiene datos históricos derivados de datos de transacciones. Los analistas de negocios utilizan esta información histórica para comprender el negocio en detalle.

Un almacén de datos debe tener las siguientes características: orientada

  1. Asunto:
  2. almacén

Un dato ayuda a analizar los datos. Por ejemplo, para conocer las ventas de una empresa, un almacén de datos debe basarse en los datos de ventas. Usando este almacén de datos podemos encontrar las ventas del año pasado. Esta capacidad de definir un almacén de datos por tema (ventas) lo convierte en un tema orientado.

  1. integrado:

Traer datos de diferentes fuentes y ponerlos en un formato coherente. Esto incluye la resolución de las unidades de medidas, los conflictos de nombres etc.

  1. no volátil:

vez que los datos de entrada en el almacén de datos, los datos no deben ser actualizados.

    variante
  1. Tiempo:

análisis del negocio, los analistas necesitan grandes cantidades de datos. Por lo tanto, el almacén de datos debe contener datos históricos.

Cuestiones relacionadas