Recientemente comencé a usar R para el análisis de datos. Ahora tengo un problema al clasificar un gran conjunto de datos de consulta (~ 1 GB en modo ASCII, sobre la memoria RAM de 4 GB de mi computadora portátil en modo binario). Uso de bigmemory::big.matrix
para este conjunto de datos es una buena solución, pero proporcionar una matriz 'm' tal en los gbm()
o randomForest()
algoritmos provoca el error:big.matrix como data.frame en R
cannot coerce class 'structure("big.matrix", package = "bigmemory")' into a data.frame
clase (m) da salida a la folowing:
[1] "big.matrix"
attr(,"package")
[1] "bigmemory"
¿Hay alguna manera de pasar correctamente una instancia big.matrix
en estos algoritmos?
si fallan otras soluciones, es posible que desee probar Revolutions. No sé si admite 'randomForest' o no, pero creo que tienen soporte para grandes necesidades de memoria. Ver, por ejemplo, 'http: // www.revolutionanalytics.com/products/enterprise-big-data.php'. Tenga en cuenta que es un software propietario. Hay una versión académica gratuita. –
¿Puede proporcionar las llamadas reales 'gbm' y' randomForest' que está utilizando? Específicamente, ¿está utilizando la interfaz de fórmula para 'randomForest'? – joran