Tengo un archivo de entrada que tiene alrededor de 20 millones de líneas. El tamaño del archivo es de aproximadamente 1.2 G. ¿De todos modos puedo trazar los datos en R. Algunas de las columnas tienen categorías, la mayoría de ellas son números.¿Trazar enormes archivos de datos en R?
He intentado mi script de trazado con un pequeño subconjunto del archivo de entrada de aproximadamente 800K líneas, pero aunque tengo aproximadamente 8G de RAM, parece que no puedo trazar todos los datos. ¿Hay alguna manera simple de hacer esto?
¿Qué esperas ver en una parcela con 20 millones de puntos de datos? – Chase
Independientemente de la capacidad de cómputo, tendrá que reducir sus datos a través de histogramas, gráficos de densidad 1D y 2D, gráficos de hexbin, ... –
... siguiendo la línea de la respuesta de @Paul Hiemstra, si le da alguna más detalles sobre (un subconjunto de) sus datos, puede obtener una interesante discusión sobre las posibilidades de visualización que se ofrecen aquí. Además, 'ggplot' podría ser más lento/más hambriento de memoria que otras posibilidades, si realmente quieres trazar cada punto. –