Estoy de acuerdo con la respuesta de alta calificación, pero que me gustaría añadir lo siguiente:
carga
* Do you use a staging area to perform the transformation and then
en el almacén?
Depende del tipo de transformación si requiere una puesta en escena. La organización por etapas ofrece beneficios de dividir el ETL en fragmentos más manejables, pero también proporciona un área de trabajo que permite manipulaciones en los datos sin afectar el almacén. Puede ayudar tener (al menos) algunas búsquedas de dimensión en un área de almacenamiento que almacena las claves del sistema OLTP y la clave del último registro atenuado, para usar como una búsqueda al cargar sus registros de hechos. La transformación ocurre en el proceso de ETL en sí, pero puede o no requerir alguna preparación para ayudarlo en el camino.
* How do you link data between the warehouse and the OLTP database?
Es útil para cargar las llaves de negocio (o claves principales reales si está disponible) en el almacén de datos como una referencia de nuevo al sistema OLTP. Además, la auditoría en el proceso DW debe registrar el linaje de cada bit de datos al registrar el proceso de carga que lo ha cargado. base de datos de
* Where/How do you manage the transformation process - in the
como sprocs, DTS/paquetes SSIS, o SQL de código de la aplicación?
Esto normalmente sería en paquetes SSIS, pero a menudo es más eficaz para transformar en la consulta de origen. Desafortunadamente, esto hace que la consulta de origen sea bastante complicada de comprender y, por lo tanto, de mantener, por lo que si el rendimiento no es un problema, es mejor transformar en el código de SSIS. Cuando haces esto, esta es otra razón para tener un área de preparación ya que puedes hacer más uniones en la consulta fuente entre diferentes tablas.
@John: ¿usó el diseño de "esquema de estrella de hechos y dimensiones" de Kimble para su modelo de almacén de datos? –
Creo que sí. Nunca leí este tipo de "Kimble", aunque las personas invocan su nombre en el almacén de datos casi tanto como las personas invocan "Knuth" en los algoritmos. Pero, de nuevo, nunca terminé ese primer libro de Knuth y terminé vendiendo todo el set. El datamart en el que estoy trabajando ahora es más un copo de nieve, ya que tenemos algunas dimensiones que tienen dimensiones. Nuestra situación es análoga a tener tanto clientes como vendedores con dimensiones, y ambos tienen geografía. –
Disculpas, quise decir Kimball, no Kimble :) –