Sé cómo producir las parcelas utilizando apalancamientoPlot(), pero no puedo encontrar una forma de generar una estadística de apalancamiento para cada observación, como en la salida de megastato.¿Cómo generar estadísticas de apalancamiento?
Respuesta
Creo que está buscando los valores de sombrero.
Use hatvalues(fit)
. La regla general es examinar cualquier observación 2-3 veces mayor que el valor promedio de sombrero. No sé de una función específica o paquete de la parte superior de mi cabeza que proporciona esta información en un marco de datos agradable, pero hacerlo usted mismo es bastante sencillo. He aquí un ejemplo:
fit <- lm(hp ~ cyl + mpg, data=mtcars) #a fake model
hatvalues(fit)
hv <- as.data.frame(hatvalues(fit))
mn <-mean(hatvalues(fit))
hv$warn <- ifelse(hv[, 'hatvalues(fit)']>3*mn, 'x3',
ifelse(hv[, 'hatvalues(fit)']>2*mn, 'x3', '-'))
hv
Para datos más grandes conjuntos podría utilizar subset
y/o order
fijarse tan sólo en ciertos valores de los rangos de los valores sombrero:
subset(hv, warn=="x3")
subset(hv, warn%in%c("x2", "x3"))
hv[order(hv['hatvalues(fit)']), ]
De hecho, me encontré con una función plot agradable eso lo hace en el libro R in Action pero como este es un libro protegido por derechos de autor, no mostraré la propiedad intelectual de Kabacoff. Pero esa trama funcionaría aún mejor para los conjuntos de datos medianos.
Aquí es un gráfico sombrero decente sin embargo, que es posible que también desee investigar:
plot(hatvalues(fit), type = "h")
- 1. Hibernate: Generar estadísticas
- 2. Apalancamiento Caché del navegador
- 3. ¿Cómo generar estadísticas para un proyecto de GitHub?
- 4. apalancamiento memoria caché del navegador
- 5. ¿Cómo puedo generar estadísticas de resumen por grupo si mi variable de agrupación es un factor?
- 6. estadísticas de matemáticas con Linq
- 7. cmake: estadísticas de compilación
- 8. ¿Cómo puedo calcular estas estadísticas?
- 9. Paquete de estadísticas de Java para estadísticas robustas
- 10. cómo restablecer todas las estadísticas de mysql?
- 11. Estadísticas de SQL Server
- 12. Python: estadísticas de código
- 13. Cómo calcular las estadísticas "t-test" con numpy
- 14. estadísticas de código de cupón
- 15. Cómo obtener estadísticas del sistema con node.js
- 16. Estadísticas R: Cómo grep una palabra exactamente
- 17. Estadísticas "inversas": generar datos en base a la media y la desviación estándar
- 18. Visual Studio Estadísticas de compilación
- 19. ¿Fingir las estadísticas de Oracle?
- 20. Herramientas estadísticas para programadores
- 21. Estadísticas zonales QGIS
- 22. Ehcache Estadísticas por clave
- 23. PHP versión adopción estadísticas?
- 24. Cómo implementar estadísticas eficientes de tiempo de ejecución de C++
- 25. ¿Cómo obtener estadísticas de uso de CPU en Android?
- 26. ¿Hay una biblioteca de estadísticas para PHP?
- 27. Diseño de esquema de colaboración en línea (¿apalancamiento de documentos de Google?)
- 28. Estadísticas e informes del proyecto TortoiseHG/Mercurial
- 29. Funciones de estadísticas de llamadas de Scipy
- 30. Estadísticas/Monitor/Inspector para beanstalkd