Estoy buscando un método eficiente (tanto de recursos informáticos como de aprendizaje/implementación) para fusionar dos marcos de datos más grandes (tamaño> 1 millón/300 KB de datos).Alternativas eficientes para fusionar para data.frames más grandes R
"fusionar" en la base R y "unir" en plyr parecen agotar toda mi memoria y bloquear mi sistema.
Ejemplo
carga test data frame
y tratar
test.merged<-merge(test, test)
o
test.merged<-join(test, test, type="all")
-
-
El siguiente post ofrece una lista de alternativas de combinación y:
How to join (merge) data frames (inner, outer, left, right)?
El siguiente permite la inspección tamaño del objeto:
https://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/
Los datos producidos por anonym
sql.df o data.table? –
Después de destripar las agradables respuestas a continuación, pude encontrar: http://stackoverflow.com/questions/4322219/whats-the-fastest-way-to-merge-join-data-frames-in-r (aunque el la pregunta no era sobre un gran df, sino sobre cómo ahorrar milisegundos, obtuvo respuestas similares a las que se muestran a continuación). –