Estamos diseñando una actualización de un sistema actual (C++ \ CLI y C#). El sistema recopilará pequeñas cantidades (~ 1Mb) de datos de ~ 10K dispositivos (en el futuro cercano). Actualmente, se usan para guardar los datos del dispositivo en un archivo CSV (una tabla) y almacenarlos en una estructura de carpetas amplia.Base de datos SQL VS. Múltiples archivos planos (miles de CSV pequeños)
Los datos solo se insertan (crear/anexar a un archivo, crear una carpeta) nunca actualizados/eliminados. El procesamiento de datos se realiza leyendo muchos CSV a un programa externo (como Matlab). Principalmente ser utilizado para el análisis estadístico.
Existe una opción para comenzar a guardar estos datos en una base de datos MS-SQL. El tiempo de proceso (leer el CSV al programa externo) podría ser de unos pocos minutos.
- ¿Cómo debemos elegir qué método usar?
- ¿Uno de los métodos requiere mucho más almacenamiento que el otro?
- En general, ¿cuándo se vuelve más rápido leer los datos brutos de una base de datos que leer los CSV? (10 archivos, 100 archivos? ...)
Agradecería sus respuestas, Los pros y contras son bienvenidos.
Gracias por su tiempo.
Esta es una de esas preguntas que solo puede responder probándola. – Gabe
También podría considerar el uso de una base de datos noSQL. – HLGEM