Mi jefe tiene la costumbre de realizar consultas en nuestras bases de datos que devuelven decenas de miles de filas y las guardan en archivos de Excel. Yo, como pasante, constantemente tengo que escribir guiones que funcionen con la información de estos archivos. Hasta ahora, he probado VBScript y Powershell para mis necesidades de scripting. Ambos pueden tardar varios minutos en realizar incluso las tareas más sencillas, lo que significa que el script, una vez terminado, tomaría la mayor parte de un día de 8 horas.Mejor lenguaje para analizar archivos extremadamente grandes de Excel 2007
Mi solución ahora es simplemente escribir un script de PowerShell que elimine todas las comas y los caracteres de nueva línea de un archivo xlsx, guarde los archivos .xlsx en .csv y luego haga que un programa Java maneje la recopilación y salida de datos y hacer que mi script elimine los archivos .csv cuando haya terminado. Esto se ejecuta en cuestión de segundos para mi proyecto actual, pero no puedo evitar preguntarme si existe una alternativa más elegante para mi próximo proyecto. ¿Alguna sugerencia?
¿Puede abrir Excel en los archivos y pedirle a Excel que haga lo que necesita? –
Bueno, eso es básicamente lo que se hace ahora. Un montón de vlookups y mesas pivotantes que traen una máquina de núcleo i7 de alta gama con 8 GB de ram de rodillas. – arcdrag
¿Esto es de alguna utilidad? Vi una demostración y parece ser rápida: http://www.powerpivot.com/demo.aspx Le permite analizar rápidamente millones de filas en Excel, los resultados interactivos se pueden agregar a Sharepoint e incluso se pueden volver a Informes Servicios para un análisis posterior. – Fionnuala