Actualmente estoy usando pandas para leer un archivo de Excel y presentar sus nombres de hoja para el usuario, para que pueda seleccionar la hoja que le gustaría usar. El problema es que los archivos son realmente grandes (70 columnas x 65k filas), tomando hasta 14 segundos para cargar en una computadora portátil (los mismos datos en un archivo CSV toman 3s).¿Cómo obtener los nombres de las hojas de los archivos XLS sin cargar todo el archivo?
Mi código de la panda es la siguiente:
xls = pandas.ExcelFile(path)
sheets = xls.sheet_names
me trataron XLRD antes, pero obtuvieron resultados similares. Esta fue mi código con XLRD:
xls = xlrd.open_workbook(path)
sheets = xls.sheet_names
Por lo tanto, puede alguien sugerir una manera más rápida para recuperar los nombres de las hojas de un archivo de Excel que leer todo el archivo?
¿Cuánto tiempo se tarda en abrir un archivo de este tipo en Excel directamente? –
@DocBrown Acerca de 4 si Excel ya está abierto (Excel Starter 2010) – pcarvalho