Tengo dos marcos de datos df1
y df2
que tienen aproximadamente 10 millones de filas y 4 columnas. Los leí en R usando RODBC/sqlQuery sin problemas, pero cuando trato de rbind
ellos, obtengo los mensajes de error más temidos de R: cannot allocate memory
. Tiene que haber formas más eficientes de hacer un rbind
de manera más eficiente: ¿alguien tiene sus trucos favoritos sobre esto que quiere compartir? Por ejemplo me encontré con este ejemplo en el documento de sqldf
:R: cómo enlazar dos enormes marcos de datos sin quedarse sin memoria
# rbind
a7r <- rbind(a5r, a6r)
a7s <- sqldf("select * from a5s union all select * from a6s")
es eso de la mejor manera/recomienda para hacerlo?
ACTUALIZACIÓN que tengo que trabajar con el argumento fundamental dbname = tempfile()
en la llamada sqldf
anterior, como sugiere JD largo en su respuesta a this question
¿Has intentado preasignar? – aL3xa
Buena idea, ¿cómo hago eso? ¿Quiere decir usar algo como 'memory.limit (size = 4000)'? –
No. Por cierto, eso funciona solo en Windows. Ver mi respuesta a continuación. – aL3xa