Tengo una aplicación que requiere análisis para diferentes niveles de agregación, y esa es la carga de trabajo OLAP. También quiero actualizar mi base de datos con bastante frecuencia.Cualquier base de datos OLAP escalable (escala de aplicación web)?
por ejemplo, esto es lo que se ve mi actualización como (esquema se parece a: tiempo, dest, IP de origen, el navegador -> visitas)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
y luego quiero preguntar cuál es la visita total a la www .stackoverflow.com desde un navegador Firefox el mes pasado.
Entiendo que el sistema Vertica puede hacer esto de una manera relativamente económica (rendimiento y escalabilidad, pero probablemente no de costo). Tengo dos preguntas aquí.
1) ¿Existe algún producto de código abierto que pueda utilizar para resolver este problema? En particular, ¿qué tan bien funciona un sistema Mondrian? (escalabilidad y rendimiento) 2) ¿Existe una solución básica de HBase o Hypertable (obviamente, una HBase/Hypertable desnuda no puede hacer esto) para esto? - pero si hay un proyecto basado en HBase/Hypertable, la escalabilidad probablemente no sea un problema de la OMI).
Gracias!
¿Cuál es su volumen de datos esperado? 1 millón de visitas/día? ¿10 millones? –