350 GB (GB creciente par de una semana) ... Todos necesitan estos datos estén disponibles para Analítica
¿Tiene gurús de MySQL en casa? Si es así, seguro => solo crea y crece ese clúster MySQL. El único problema con esta solución no es que sea MySQL, y no es que sea no un NoSQL => es literalmente porque requiere un experto para configurarlo y siempre estará allí a tu lado por si acaso Necesita ser cambiado. Pero adivine qué => SQL es MUCHO mejor y más simple para el análisis que una simulación de SQL de mapa/reducción.
Algo que puede convertirse un problema más adelante con una solución de Oracle MySQL es . Así que asegúrese de comprender qué características de MySQL puede usar de forma gratuita y qué funciones debería pagar.
Si lo hace no tiene un experto en MySQL en la casa, o no le gustaría pagar por uno, definitivamente puede recurrir a NoSQL. Sin embargo, esto no significa que no necesite una experiencia en productos NoSQL, sino que configure y ejecute nodos X ya que un solo sistema es un proceso extremadamente simple y natural para las soluciones NoSQL.
Por ejemplo, en Riak, y un par de otras bestias NoSQL, la mayoría de las complejidades de distribución son resueltas por el producto sin necesidad de hacer nada en absoluto => realmente es así de simple.
El precio que se paga con NoSQL está perdiendo SQL (pensar en buenas características de agregación) y la consistencia, que es eventual, y si estrictamente haciendo análisis, para usted, la consistencia no puede ser un precio en absoluto.
A cambio, obtiene un manejo Big Data muy natural, tolerancia a fallas y much more.
Si está en el espacio Hadooooxyz, y está bien que pague, eche un vistazo a Hadapt, que promete 5 veces el rendimiento de Hive.
¿Debo evitar un problema al intentar extraer más y más datos en mysql? – AlgoMan
No se trata tanto de la cantidad de datos que se almacenan, sino de cómo se usa, y de cómo el uso y el diseño subyacente del DB afecta el rendimiento resultante/satisface las necesidades del negocio. Supongo que mi punto es que (a) NoSQL no es de ninguna manera un reemplazo de MySQL, es solo otra opción, y (b) es una especie de "herramienta adecuada para el trabajo correcto" tipo de pregunta. – jefflunt