Procedo una gran cantidad de texto/datos que intercambio entre Python, R y, en ocasiones, Matlab.SQLite o archivo de texto plano?
Mi ir es el archivo de texto plano, pero también utiliza SQLite de vez en cuando para almacenar los datos y el acceso de cada programa (aunque no de Matlab). No utilizo GROUPBY, AVG, etc. en SQL tanto como hago estas operaciones en R, por lo que no necesito necesariamente las operaciones de la base de datos.
Para aplicaciones que requieren intercambiar datos entre programas para hacer uso de las bibliotecas disponibles en cada idioma, ¿existe una buena regla general sobre qué formato/método de intercambio de datos usar (incluso XML o NetCDF o HDF5)?
Sé que entre Python -> R hay rpy o rpy2 pero me preguntaba sobre esta pregunta en un sentido más general: uso muchas computadoras que no tienen rpy2 y también uso algunas otras piezas de análisis científicos software que requiere acceso a los datos en varias ocasiones (las etapas de procesamiento y análisis también están separadas).
+1 para sqlite y anticipando el uso extensivo de la base de datos en el futuro, aunque no es obvio en este momento. –
Gracias, sí, no leer el archivo completo definitivamente es su ventaja. – hatmatrix