2009-11-22 48 views
22

¿Alguien tiene experiencia en el uso de PostgreSQL para una configuración OLAP, usando cubos contra la base de datos, etc. Habiendo encontrado una serie de idiosincrasias al usar MySQL para OLAP, hay razones a favor de utilizar PostgreSQL (suponiendo que Quiero ir a la ruta de código abierto)?Postgresql para OLAP

+3

Estamos utilizando PostgreSQL 9.1 y Saiku. Todos los esquemas de cubo se definen en Schema Workbench (Pentaho). Hasta ahora, no veo ningún problema con dicha configuración. Tenemos tablas de hechos con aprox. 1,000,000 filas y todo funciona bien sin ninguna agregación previa. –

Respuesta

15

Hay un número de proveedores de software de almacenamiento de datos que se basan en Postgresql (y contribuyen con los cambios relacionados con OLAP de vuelta al núcleo con bastante regularidad). Consulte http://www.greenplum.com/ (nueva URL: http://www.greenplum.org/). Creo que encontrará que PG funciona mucho mejor (para casi cualquier carga de trabajo, especialmente OLAP) que MySQL. Greenplum y otras soluciones similares deberían funcionar un poco mejor que PG dependiendo de sus conjuntos de datos y casos de uso.

+0

enlace de interés - ¡gracias! – davek

+1

Humm ... parece que este enlace ya no está activo. ¿Tienes una alternativa? – neouser99

+1

@ neouser99 Lo cambian a http://greenplum.org/ –

0

PGSQL es mucho más adecuado para Data Warehousing en comparación con MySQL. Inicialmente pensamos en ir con MySQL, pero funciona mal en agregaciones si los datos crecen a unos pocos millones de filas. PGSQL realiza casi 20 veces más rápido en caparison con MySQL para 20 millones de registros para una única tabla de hechos en la misma configuración de hardware. Si por alguna razón elige ir con MySQL, entonces debe usar el motor de almacenamiento MyISAM para las tablas de hechos en lugar de InnoDB; verás un rendimiento ligeramente mejor.

Cuestiones relacionadas