¿Hay alguna manera de importar el conjunto de datos SPSS en Python, preferiblemente el formato NumPy recarray? He buscado pero no he podido encontrar ninguna respuesta.Importación del conjunto de datos SPSS en Python
Joon
¿Hay alguna manera de importar el conjunto de datos SPSS en Python, preferiblemente el formato NumPy recarray? He buscado pero no he podido encontrar ninguna respuesta.Importación del conjunto de datos SPSS en Python
Joon
Tal vez esto ayude: lector de Python + escritor de archivos SPSS SAV (Linux, Mac & de Windows) http://code.activestate.com/recipes/577811-python-reader-writer-for-spss-sav-files-linux-mac-/
reclamaciones a la importación y exportación de SPSS en una variedad de formatos, como lo hace el R statistical suite. Nunca he tratado con los datos de SPSS, por lo que no puedo hablar de sus méritos relativos.
SPSS tiene una amplia integración con Python, pero está destinado a ser utilizado con SPSS (ahora conocido como IBM SPSS Statistics). Hay un controlador ODBC de SPSS que podría usarse con el soporte ODBC de Python para leer un archivo sav.
O simplemente podría guardarlo en el formato que desee utilizando Python desde dentro de SPSS, supongo? Ambas soluciones requieren que 'joon' tenga acceso a SPSS (que es bastante costoso AFAIK). – JanC
Para ser claros, el controlador ODBC de SPSS no requiere una instalación de SPSS.
Tal vez esto sea útil para alguien:
http://sourceforge.net/search/?q=python+SPSS
buena suerte!
Michal
Usted podría tener Python hacer una llamada externa a spssread, un script en Perl que da salida al contenido de los archivos de SPSS en la forma que desee.
Opción 1 Como rkbarney señaló, no está disponible a través de PyPI la savReaderWriter Python. Me he encontrado con dos problemas:
Opción 2 he optado por utilizar R como un intermediario. Usando rpy2, configuré una función simple para leer el archivo en un marco de datos R y lo volví a sacar como un archivo CSV que luego importé a python. Es un poco rube-goldberg pero funciona. Por supuesto, esto requiere R, que también puede ser una tarea difícil de instalar en su entorno (y tiene diferentes binarios para diferentes plataformas).
John, sería tan amable de publicar (en una esencia de GitHub o en pastebin.com) el código en su enfoque basado en rpy2? Estoy luchando con este problema http://stackoverflow.com/q/36287936/1389110, y su enfoque puede ayudar. – Pyderman
¡Muchas gracias! Este es el tipo de cosas que estaba buscando ... parece muy útil. – joon