En mi entorno python, los paquetes Rpy y Scipy ya están instalados.Python: manejo de un gran conjunto de datos. Scipy o Rpy? ¿Y cómo?
El problema quiero abordar es tal:
1) Un gran conjunto de datos financieros se almacenan en un archivo de texto. No es posible cargar en Excel
2) Necesito sumar ciertos campos y obtener los totales.
3) Necesito mostrar las 10 filas principales basadas en los totales.
¿Qué paquete (Scipy o Rpy) es el más adecuado para esta tarea?
Si es así, ¿podría proporcionarme algunos consejos (por ejemplo, documentación o ejemplos en línea) que puedan ayudarme a implementar una solución?
La velocidad es una preocupación. Idealmente escabroso y Rpy puede manejar los archivos de gran tamaño cuando incluso los archivos son tan grandes que no se pueden instalar en la memoria
Puede encontrar información útil en http://www.dabeaz.com/generators-uk/ – lazy1
¿Qué significa 'conjunto enorme' exactamente en su caso? – radek