Mi problema es a continuación, pero estaría interesado comentarios de cualquier persona con experiencia con xlrd.¿Cómo leo un archivo de Excel en Python usando xlrd? ¿Puede leer los formatos de Office más nuevos?
Acabo de encontrar xlrd y parece ser la solución perfecta, pero estoy teniendo un pequeño problema para empezar. Estoy intentando extraer datos programáticamente de un archivo de Excel que extraje de Dow Jones con los componentes actuales del Dow Jones Industrial Average (enlace: http://www.djindexes.com/mdsidx/?event=showAverages)
Cuando abro el archivo sin modificaciones recibo un desagradable error BIFF (formato binario no reconocida)
Sin embargo se puede ver en la captura de pantalla que Excel 2008 para Mac cree que está en formato 'Excel 1997-2004' (captura de pantalla: http://skitch.com/alok/ssa3/componentreport-dji.xls-properties)
Si en lugar de abrirlo en Excel manualmente y guardar como ' Formato Excel 1997-2004 'explícitamente, luego abierto en python usig xlrd, todo es maravilloso. Recuerde, Office cree que el archivo ya está en formato 'Excel 1997-2004'. Todos los archivos son .xls
Aquí está un Pastebin de una sesión ipython replicar el tema: http://pastie.textmate.org/private/jbawdtrvlrruh88mzueqdq
Alguna idea sobre: cómo engañar a XLRD a reconocer el archivo para que pueda extraer datos? ¿Cómo se usa Python para automatizar el formato explícito 'guardar como' en uno que xlrd aceptará? Plan B?
nop no casada con XLRD. echando un vistazo a pyExcelerator ahora ... –
Parece que no hay mucha documentación disponible para pyExcelerator. ¿Podría mostrarme los conceptos básicos de abrir un archivo y extraer datos? –