2011-08-02 7 views

Respuesta

6

Básicamente, colmena es un lenguaje de programación similar a SQL incorporado en MapReduce. Cuando emite comandos, los comandos se interpretan y ejecutan sobre el sistema distribuido. Como los archivos que se procesan son planos, es equivalente a ejecutar un código equivalente en Hadoop y recopilar los datos. Todo el flujo es mucho más lento de lo que sería si usaras Mysql.

+0

Me pregunto, ¿cuánto más lento? y para qué uso del caso? A veces, incluso el ordenamiento de comandos de línea unix es más rápido que una ordenación de mysql. – arivero

+0

Mysql puede ser lento si las cosas no están indexadas, pero si lo son, es casi seguro que será mucho más rápido que la colmena. – delmet

8

La principal diferencia entre las bases de datos RDBM y Hive es la especialización. Si bien MySQL es una base de datos de propósito general adecuada tanto para el procesamiento transaccional (OLTP) como para el análisis (OLAP), Hive está diseñada solo para el análisis. Técnicamente, la principal diferencia es la falta de actualización/eliminación
functioality. Los datos solo pueden ser agregados y seleccionados. Al mismo tiempo, Hive es capaz de procesar volúmenes de datos que no pueden ser procesados ​​por MySQL u otros RDBMS convencionales (en un presupuesto tímido).
Las bases de datos de MPP (projecto en paralelo masivo) son las más cercanas a la Colmena por su funcionalidad: a pesar de que tienen soporte completo de SQL, son escalables hasta en cientos de computadoras. Otro serio diferente - es el lenguaje de consulta.
Hive no es compatible con SQL completo, incluso en seleccionar debido a su implementación. En mi opinión, la principal diferencia es la falta de unión para cualquier condición que no sea igual. El lenguaje de consulta de Hive sintax también es un poco diferente, por lo que no puede conectar el software de generación de informes directamente a Hive.

0

Esto no es exactamente una respuesta a la pregunta original, pero pareció exceder el tamaño máximo de comentario por 47 caracteres.

Cuando utiliza un almacén de datos OLAP utilizando HDFS y Hive, no tiene absolutamente ninguna posibilidad de actualizar los datos de hecho. Puede hacerlo de la misma manera que muchos buenos almacenes de datos basados ​​en RDBS, mediante el intercambio de particiones entre el escenario y el almacén. Las particiones de tabla en Hive se implementan como directorios HDFS, por lo que el intercambio de particiones es (casi) instantáneo: es el tiempo necesario para cambiar el nombre de un directorio HDFS. Bueno, tendrá que llamar a HDFS directamente, evitando la interfaz de Hive y probablemente empleará MapReduce para mantener el escenario, pero en los datawarehouses desarrollados por la empresa para la que trabajo, resultó ser un buen enfoque.

0

Una buena referencia en la colmena y en qué se diferencia de las bases de datos tradicionales se pueden leer en el puesto Hive- A SQL like database over Hadoop en mi blog: Hadoop,HDFS, Map-Reduce and Hive

1

Colmena se inventó en Facebook y de su justo como SQL, pero con poco apoyo para el interior consultas. Le permite utilizar todos los tipos de uniones, las funciones de grupo como en Sql también proporcionan funciones definidas por el usuario (UDF) que se pueden escribir en Java o en cualquier otro idioma y se pueden usar en Hive.

Colmena se utiliza principalmente cuando los datos son grandes para que se pueda realizar la partición o la agrupación y no se utiliza generalmente para insertar o actualizar una sola fila como lo hicimos en Sql.

2

colmena frente a la base de datos tradicional Colmena -> Esquema de LEER - es no comprobar el esquema mientras se carga los datos de la base de datos tradicional ---> Esquema de ESCRITURA - esquema de la tabla se hace cumplir en tiempo de carga de datos i.E Si se cargan los datos del does't conformada en esquema en ese caso será rechazado

Colmena -> Es muy fácilmente escalable a bajo costo
base de datos tradicional ---> No mucho escalable, costoso escala hacia arriba.

Colmena -> Se basa en la notación hadoop que es escribir una vez y leer muchas veces
base de datos tradicional ---> En la base de datos tradicional podemos leer y escribir muchas veces Colmena -> cambios de nivel de grabación no es posible Colmena en
base de datos tradicional ---> cambios a nivel de registro, inserciones y eliminaciones , transacciones e índices son posibles

Colmena -> OLTP (On-line Transaction Processing) aún no se admite en la colmena pero está apoyado OLAP (Procesamiento analítico en línea) Base de datos tradicional ---> OLTP (procesamiento de transacciones en línea) y OLAP (en línea) Procesamiento analítico) son compatibles con RDBMS.

o de lo contrario por favor revise el siguiente URL

https://sensaran.wordpress.com/2016/01/30/comparison-with-hive-with-traditional-database/

+0

Desde la versión 0.14 actualización de nivel de registro de soporte de colmena. – Sonu

Cuestiones relacionadas