2012-01-07 15 views
8

Estoy empezando a aprender a hacer análisis de datos en Python.Funcionalidad .rdata similar en Python?

En R, se pueden cargar datos en la memoria, a continuación, guardar las variables en un archivo .rdata.

estoy tratando de crear un "proyecto" análisis, por lo que puede cargar los datos, almacenar las secuencias de comandos, a continuación, guardar la salida por lo que puedo recordar que debería necesitar.

¿Existe una función equivalente en Python?

Gracias

Respuesta

11

Lo que estamos buscando es la serialización binaria. La funcionalidad más notable para esto en Python es pickle. Si tiene algunas estructuras de datos científicos estándar, podría ver HDF5 en su lugar. JSON también funciona para muchos objetos, pero no es una serialización binaria, está basada en texto.

Si expande sus opciones, hay un montón de otras opciones de serialización, también. Como Buffers de Protocolo de Google (el desarrollador de Rprotobuf es el respondedor mejor clasificado para la etiqueta en SO), Avro, Thrift y más.

Aunque hay opciones de serialización genéricos, tales como pickle y .Rdat, la consideración cuidadosa de su uso será útil en la toma de E/S rápida y adecuada a sus necesidades, especialmente si necesita acceso aleatorio, la portabilidad, acceso paralelo, herramienta reutilización, etc. Por ejemplo, ahora tiendo a evitar .Rdat para objetos grandes.

Cuestiones relacionadas