Estoy trabajando para una empresa que ejecuta un producto de software basado en un servidor de base de datos MS SQL, y a través de los años he desarrollado 20-30 informes bastante avanzados en PHP, tomando datos directamente de la base de datos. Esto ha sido muy exitoso, y la gente está feliz con eso.¿Qué debería tener en cuenta al construir una solución OLAP desde cero?
Pero tiene algunos inconvenientes:
- Para los nuevos cambios, que puede ser bastante intenso desarrollo
- El usuario no puede experimentar mucho con los datos - que está bloqueado a una visión rígida
- puede ser lento para grandes informes
que estoy considerando poco a poco van a un enfoque basado en OLAP, que se puede consultar desde Excel o algún servicio basado en web. Pero me gustaría hacer esto de una manera que introduzca la menor cantidad de nueva complejidad en el entorno de TI: la menor cantidad de servicios diferentes, trabajos de sincronización, etc.
Tengo algunas preguntas al respecto:
1) relacionados Workflow-:
- ¿Qué es una buena ruta de desarrollo de "servidor SQL cuadro negro" a "OLAP listo para usar" ?
- ¿Qué servidores y servicios se deben configurar y qué scripts se deben escribir?
- ¿Cuáles son las partes más difíciles/más críticas/que consumen más tiempo?
2) ETL:
- supongo que lo mejor es tener servidores separados para su almacén de datos y SQL Producción?
- ¿Cómo se mantienen sincronizados (push/pull)? ¿Utilizando qué tecnologías/idiomas?
- Para mí, SSIS parece demasiado complicado, y el flujo de trabajo gráfico no me atrae mucho; prefiero un script basado en texto que haga el trabajo. ¿Es esto factible?
- ¿O es ventajoso utilizar el cliente gráfico con una sola fuente y un destino?
3) Desarrollo:
- ¿Cuánto de esto (la integración de datos, servicios de análisis) se pueden mantener de manera eficiente desde una CLI-herramienta?
- ¿Se puede transferir la configuración entre la producción y el desarrollo fácilmente?
Estoy satisfecho con cualquier respuesta que cubra solo algo de esto, y aunque es un entorno de MS, también me interesan las ventajas de otras tecnologías.
¿Podría aclarar pt. 2? En mis escasos experimentos con cubos OLAP, ha sido muy difícil usar el modelo de datos existente para construir un cubo: ¿no suele ser el caso que los datos deben "desnormalizarse" a un esquema de estrella/copo de nieve en la herramienta ETL? ? –
Expandí en el punto 2 según su pedido. Avíseme si necesita que agregue comentarios adicionales. –
Gracias por mencionar el nombre de Kimball: parece que estos libros http://www.ralphkimball.com/html/books.html tienen mucho sobre las mejores prácticas en el diseño de Data Warehouse, y los conseguiré. . –