2010-04-09 22 views
5

Así que hay algo nuevo y genial, estas bases de datos NoSQL. Y así están mis datos: filas de filas de filas de datos meteorológicos: valores, que representan ciertas mediciones en una determinada estación (identificadas por un número de OMM, no coordenadas), en un momento determinado.NoSQL y datos meteorológicos

no todas las estaciones medidas de todos los parámetros, no todos los parámetros se mide todo el tiempo.

Guardo esta información (valores válidos por hora de 30 años, que dan como resultado ~ mil millones de valores) actualmente en MySQL. El crecimiento continuo y la adición previsible de aún más datos me dan un poco de dolor de cabeza.

Leyendo acerca de los sistemas NoSQL basados ​​en documentos que parecen escalar con bastante facilidad, me preguntaba si NoSQL es también un concepto de almacenamiento de datos viable para datos meteorológicos. ¿Tienes alguna experiencia con esto?

Actualización: se olvidó de las consultas típicas: la mayoría de las consultas necesitan datos en el eje temporal: es decir, dame las temperaturas de la estación 066310 del 01.01.2010 00:00 al 01.03.2010 00:00.

O: dame los valores más recientes de todos los parámetros de una estación en particular.

+0

Lo que realmente necesitamos saber si debemos ser capaces de responder la pregunta es ¿cómo está utilizando sus datos. ¿Qué tipo de consultas lo ejecutas? – adamse

+0

Ah, lo olvidé. Gracias, he agregado dos muestras. –

+0

¿Qué es exactamente lo que le está dando dolor de cabeza? Manejo de la base de datos? ¿Actuación? ¿Agregando los datos? ¿Algo más? Si su rendimiento está relacionado, ¿ha analizado el plan de consultas para sus consultas? Tal vez necesite mejores índices o ajuste la configuración de su base de datos (en este sentido, PostgreSQL es excelente). ¿Qué tan grande es su conjunto de datos? En cuanto al disco. 1GB? ¿Más? ¿Menos? – Mike

Respuesta

2

NoSQL podría funcionar si tu estructura de datos es bastante simple (por ejemplo, un simple almacén de clave-valor)/predecible y no necesitas integridad relacional o una necesidad de consultas ad-hoc y/o avanzadas.

Lo que se gana en la fácil escalabilidad es posible que pierda flexibilidad y consistencia sin embargo.

El mayor problema sería tener un medio fácil para redactar consultas complejas sobre sus datos. Yo diría que los datos meteorológicos no son los mejores candidatos para NoSQL.

Personalmente prefiero PostgreSQL sobre MySQL y lo encuentro muy escalable (incluso con millones o incluso miles de millones de filas) cuando se configura correctamente.

+0

Esto no es del todo correcto. NoSQL también puede adaptarse a datos muy complejos, piense en bases de datos de gráficos, por ejemplo. Luego también están las áreas de almacenamiento de datos NoSQL con valores clave más simples. Existe una gran variedad de soluciones NoSQL. – adamse

+0

@adamse: buen punto sobre la amplitud del término NoSQL, aunque creo que una base de datos de gráficos no sería la más adecuada para los datos meteorológicos ;-) – ChristopheD

+0

No, obviamente no :) – adamse

1

Me resulta difícil de crear una respuesta coherente en este momento, pero aquí va.

  1. Sus datos encajarían sin problemas en un almacén de datos "NoSQL" como Cassandra (y muchos más probablemente)
  2. Se podría beneficiarse del diseño sin esquema de muchas soluciones "NoSQL" (ya que no todos las columnas (para usar un término MySQL) están presentes todo el tiempo)
  3. Las consultas basadas en el tiempo no serían un problema en Cassandra (revise las claves basadas en TimeUUID)
  4. Parece que no está aprovechando la parte relacional de MySQL, por lo que no estaría tan lastimado al perderlo
  5. Aunque podría estarlo bien con MySQL, ya que realmente no estás describiendo el tipo de problemas, ¿realmente estás teniendo alguno?(El simple hecho de estar interesado es totalmente genial)
  6. Las cosas como los índices y la búsqueda son cosas que tendrías que implementar manualmente en muchos almacenes de datos nosql, si esto te asusta quizás te quedes con sql.

Gracias por su atención;)

+0

Echaré un vistazo a Cassandra. Gracias por el aporte. –