2012-09-17 10 views
7

Acabo de empezar a aprender R y necesito ayuda para encontrar la media y la mediana de los residuos para mis datos. He calculado la película y en el resumen consigo residuos como sigue:media y mediana de residuos de un modelo lineal

min  1Q  median 3Q  Max 
-111.86 -34.90  -7.6 33.46 182.58 

Pregunta: por lo que la mediana de residuos es -7.6 pero que es mi media? ¿O hay un cálculo para encontrar la media y la mediana de los residuos? que iba a hacer la media (resid (trees.lm) o debe introducirse como media (trees.lm $ resid)

Por favor, aclarar porque mis compañeros todos reciben respuestas diferentes para el mismo conjunto de datos.

Respuesta

6

la respuesta a la pregunta específica aquí es:.

mean(resid(trees.lm)) 

no debe ahondar en los objetos del modelo equipado como este y tira a componentes arbitrarios Si lo hace, en algo un poco más complicado como un GLM morderá su entregar cuando se da cuenta de que acaba de extraer los residuos de trabajo a través de:

glm.mod.obj$residuals 

que es poco probable que te sean útiles.

Incluso para cosas simples como lm() objetos, lo utiliza resid() o acceder $residuals puede ser diferente dependiendo de cómo se monta el modelo (lo que fue el escenario de la discusión na.action por ejemplo?).

Además, el modelo lineal supone que los residuos son i.i.d. Variables aleatorias gaussianas (o normales) con media 0 y varianza $ \ hat {\ sigma}^2} $, por lo que la media debería ser muy cercana a 0 (es decir, muy, muy, muy cerca de 0 pero no exactamente porque es una computadora y la aritmética de punto flotante está en juego).

+2

Independientemente de cómo se ajuste el modelo, la media de los residuos será cercana a cero. Esto nunca debería ser sorprendente en OLS. – Max

+0

Vaya, tenía algo más en mente cuando estaba escribiendo eso y tiene toda la razón. Editando mi estupidez –

+0

En OLS, la suma de los residuos es exactamente igual a cero. Es una propiedad de minimizar los residuos al cuadrado. –

Cuestiones relacionadas