¿Cómo puedo usar el paquete R randomForest
con pesos de observación? Sé que no hay tal opción en este paquete. Tengo 2 preguntas:Incorporación de pesos de observación en el paquete randomForest
¿Existe alguna solución a este problema usando
randomForest
paquete? En este momento estoy tomando muestras a partir de datos con pesas como la probabilidad por lo que al menos puedo simularlo:m = dim(data)[1] sample(data, m, replace=TRUE, prob=weights)
Funciona ¿Hay otras soluciones (mejor)?
¿Hay alguna alternativa al paquete
randomForest
? Encontré el paqueteparty
(cforest) pero es terrible en términos de administración de memoria (o no puedo usarlo de la misma manera que uso el paqueterandomForest
). Tengo alrededor de 200k observaciones y 30-40 variables.
EDIT:
Lo siento por no aclarar los detalles. Estoy usando el paquete randomForest
para el problema de regresión (no clasificación). Es una serie temporal y cada observación tiene su peso. Más tarde, este peso se usa para determinar el rendimiento del modelo en las observaciones de prueba. La variable y es continua.
podrían encontrar más interés en http://stats.stackexchange.com –