Actualmente estoy trabajando en algunos proyectos con MongoDB y Apache Cassandra respectivamente. También estoy usando Solr mucho y estoy manejando "montones" de datos con ellos (aproximadamente 1-2 TB). He oído hablar de Greenplum y Vertica la primera vez en la última semana y no estoy muy seguro de dónde ponerlos en mi cerebro. Me parecen soluciones de Dataware House (DWH) y realmente no he trabajado DWH. Y parecen costar mucho dinero (por ejemplo, $ 60k para almacenamiento de 1TB en Greenplum). Yo actualmente no estoy manejando petabyte de datos y no haré lo que creo, pero los productos como Cassandra también parecen ser capaces de manejar esteVentajas de bases de datos como Greenplum o Vertica en comparación con MongoDB o Cassandra
Cassandra es el líder reconocido NoSQL cuando se trata de cómodamente escalar a terabytes o petabytes de datos.
Así que mi pregunta: ¿Por qué la gente use Greenplum & Co? ¿Hay una gran ventaja en comparación con estos otros productos?
Gracias.
Cabe mencionar que Vertica puede ingerir datos de Hadoop. No son mutuamente excluyentes. – geoffrobinson
Ninguno de los enlaces provistos funciona. The Emerging Data Landscape muestra 404 y el seminario web bajo demanda no muestra ningún video. ¿Te importa actualizar los enlaces? – Kingz
Aquí está el enlace actualizado: http://tdwi.org/whitepapers/2011/10/users-guide-to-the-emerging-database-landscape-row-vs-columnar-vs-nosql.aspx – user398039