Realmente he estado luchando para convertir SQL Server en algo que, francamente, nunca será. Necesito un motor de base de datos para mi trabajo analítico. El DB debe ser rápido y NO necesita todo el registro y otros gastos generales encontrados en las bases de datos típicas (SQL Server, Oracle, DB2, etc.)Tiendas de columnas: Comparación de bases de datos basadas en columnas
Ayer escuché Michael Stonebraker speak at the Money:Tech conference y seguí pensando, "No estoy realmente loco. ¡HAY una mejor manera! " Habla sobre el uso de column stores en lugar de bases de datos orientadas a filas. Fui a la página de Wikipedia para column stores y veo algunos proyectos de código abierto (que me gustan) y algunos proyectos comerciales/de código abierto (que no entiendo del todo).
Mi pregunta es esta: en un entorno analítico aplicado, ¿cómo difieren los diferentes DB basados en columnas? ¿Cómo debería estar pensando en ellos? ¿Alguien tiene experiencia práctica con sistemas basados en múltiples columnas? ¿Puedo aprovechar mi experiencia SQL con estos DB o tendré que aprender un nuevo idioma?
En última instancia voy a tirar datos a R para su análisis.
EDIT: Me pidieron una aclaración sobre qué es exactamente lo que estoy tratando de hacer. Por lo tanto, aquí hay un ejemplo de lo que me gustaría hacer: Cree una tabla que tenga 4 millones de filas y 20 columnas (5 valores débiles, 15 datos). Cree 5 tablas de agregación que calculen max, min y average para cada uno de los hechos. Une esas 5 agregaciones a la mesa de inicio. Ahora calcule la desviación porcentual de la media, la desviación porcentual de min y la desviación porcentual del máximo para cada fila y agréguelo a la tabla original. Los datos de esta tabla no reciben nuevas filas cada día, se reemplaza TOTALMENTE y el proceso se repite. El cielo no lo permita si el proceso debe detenerse. Y los registros ... ohhhhh, los registros! :)
¿Cuál es la herramienta ETL más fácil de usar para LucidDB? ¿Tetera? –
JD, ¿finalmente ha probado LucidDB desde R? ¿La forma de RJDBC funciona a la perfección con LucidDB? Deseoso de conocer su experiencia. –
Escribí una comparación de diferentes bases de datos orientadas a columnas aquí: http://www.timestored.com/time-series-data/column-oriented-databases –