Ahora estoy usando PyExcelerator para leer archivos de Excel, pero es extremadamente lento. Como siempre necesito abrir archivos de Excel de más de 100MB, me lleva más de veinte minutos cargar solo un archivo.¿Cómo abrir rápidamente el archivo Excel en Python?
La funcionalidad que necesito son:
- abrir archivos de Excel, seleccionar tablas específicas, y cargarlos en un objeto Dict o Lista.
- A veces: Seleccione columnas específicas y solo cargue líneas completas que tengan las columnas específicas en valores específicos.
- Lea archivos Excel con contraseña protegida.
Y el código que estoy utilizando ahora es:
book = pyExcelerator.parse_xls(filepath)
parsed_dictionary = defaultdict(lambda: '', book[0][1])
number_of_columns = 44
result_list = []
number_of_rows = 500000
for i in range(0, number_of_rows):
ok = False
result_list.append([])
for h in range(0, number_of_columns):
item = parsed_dictionary[i,h]
if type(item) is StringType or type(item) is UnicodeType:
item = item.replace("\t","").strip()
result_list[i].append(item)
if item != '':
ok = True
if not ok:
break
¿Alguna sugerencia?
¿Ha probado otras bibliotecas todavía? (No tengo ningún conocimiento técnico sobre este tema, solo estoy interesado) – Trufa
Sí, lo intenté, pero esos siempre no tienen funcionalidad para escribir xls. Después de leer el gran xlses tengo que hacer algunos cálculos y guardar los resultados en un pequeño xls también. –
@FelixYan: Está bien saberlo, ¡espero que tengas buenas respuestas! – Trufa