¿Alguien sabe cómo calcular la tasa de error para un árbol de decisión con R? Estoy usando la función rpart()
.¿Cómo calcular la tasa de error de un árbol de decisión?
Respuesta
Suponiendo que se refiere a la tasa de error de cálculo en la muestra utilizada para adaptarse al modelo, puede usar printcp()
. Por ejemplo, usando el ejemplo en línea,
> library(rpart)
> fit <- rpart(Kyphosis ~ Age + Number + Start, data=kyphosis)
> printcp(fit)
Classification tree:
rpart(formula = Kyphosis ~ Age + Number + Start, data = kyphosis)
Variables actually used in tree construction:
[1] Age Start
Root node error: 17/81 = 0.20988
n= 81
CP nsplit rel error xerror xstd
1 0.176471 0 1.00000 1.00000 0.21559
2 0.019608 1 0.82353 0.82353 0.20018
3 0.010000 4 0.76471 0.82353 0.20018
El Root node error
se usa para calcular dos medidas de rendimiento predictivo, al considerar los valores mostrados en la columna de la rel error
y xerror
, y en función del parámetro de complejidad (primera columna) :
0,76471 x 0,20988 = 0,1604973 (16,0%) es la tasa de error resubstitution (es decir, tasa de errores calculada en la muestra de entrenamiento) - esto es aproximadamente
class.pred <- table(predict(fit, type="class"), kyphosis$Kyphosis) 1-sum(diag(class.pred))/sum(class.pred)
0,82353 x 0,20988 = 0,1728425 (17,2%) es el tasa de error de validación cruzada (utilizando 10 veces CV, ver
xval
enrpart.control()
; pero vea tambiénxpred.rpart()
yplotcp()
que se basa en este tipo de medida). Esta medida es un indicador más objetivo de la precisión predictiva.
en cuenta que es más o menos de acuerdo con la precisión de la clasificación de tree
:
> library(tree)
> summary(tree(Kyphosis ~ Age + Number + Start, data=kyphosis))
Classification tree:
tree(formula = Kyphosis ~ Age + Number + Start, data = kyphosis)
Number of terminal nodes: 10
Residual mean deviance: 0.5809 = 41.24/71
Misclassification error rate: 0.1235 = 10/81
donde Misclassification error rate
se calcula a partir de la muestra de entrenamiento.
- 1. Biblioteca para generar un árbol de decisión
- 2. multivariado alumno árbol de decisión
- 3. Clasificador de árbol de decisión interactiva
- 4. Árbol de decisión frente a Clasificador bayesiano
- 5. Calcular TAE (tasa anual) Programatically
- 6. Cómo implementar un árbol de decisión en JavaScript. Buscando una mejor solución que mis feos
- 7. ¿Mejor algoritmo de aprendizaje para hacer un árbol de decisión en Java?
- 8. Ayuda Comprensión de validación cruzada y árboles de decisión
- 9. Motores de inferencia vs Árboles de decisión
- 10. Algoritmo para calcular la unión en el diagrama de decisión binario suprimido cero
- 11. Diferentes algoritmos de árbol de decisión con comparación de complejidad o rendimiento
- 12. Patrón de diseño para gran árbol de decisión basado en IA en C++
- 13. cómo medir la tasa de contención de una cerradura
- 14. ¿Cómo especificar la tasa de bits para la compresión JPEG?
- 15. ¿Detecta la tasa de compresión JPG?
- 16. ¿Manera eficiente de calcular recursivamente el árbol dominador?
- 17. AVAudioPlayer tasa
- 18. Técnicas para mejorar la tasa de transacción
- 19. Error serialización de un árbol de objetos con SplObjectStorage
- 20. Cómo calcular punteros en un árbol binario con el diseño de van Emde Boas
- 21. ¿Cuál es la tasa de compresión máxima teóricamente posible?
- 22. ¿Cómo calcula Amazon RDS la tasa de E/S?
- 23. Decisión de diseño de patrón de depósito MVC
- 24. Software embebido Tasa de defectos
- 25. .net 4.0 Tasa de adopción
- 26. ¿Cómo calculo la distancia de edición de árbol?
- 27. cómo calcular la norma euclidiana de un vector en R?
- 28. Baja Tasa de aciertos de la caché de tabla MySQL
- 29. decisión de tipo basado en la existencia de typedef anidada
- 30. Error: "Las llamadas a mailbox_fql han excedido la tasa de 300 llamadas por 600 segundos"