No entiendo muy bien qué significa el valor p en esta salida. No me refiero a los valores p como tales, pero en este caso.Comparando dos modelos lineales con anova() en R
> Model 1: sl ~ le + ky
> Model 2: sl ~ le
Res.Df RSS Df Sum of Sq F Pr(>F)
1 97 0.51113
2 98 0.51211 -1 -0.00097796 0.1856 0.6676
Me sale algo así, y ahora me pregunto qué modelo es el que mejor se adapta. Como solo hay UNO y no DOS valores P me estoy confundiendo. Puedo obtener diferentes pvalues utilizando resumen (model1) o resumen (model2)
Ahora bien, si
> fm2<-lm(Y~X+T)
(t ser mi indicador variable) y
> fm4<-lm(Y~X)
si hago
> anova(fm2,fm4)
esto prueba la hipótesis nula H0: alpha1==alpha2
(Ha: alpha1!=alpha2)
c (alfa ser mi origen) Así se comprueba si es mejor tener uno de intercepción (=>alpha1==alpha2
), o dos intercepciones (alpha1!=alpha2
)
En este caso estaríamos ahora, obviamente, rechazar la hipótesis nula, como el valor p es 0.6676.
Esto significa que deberíamos seguir con el modelo fm4
, ya que es más apropiado para nuestros datos.
¿Saqué las conclusiones, correcto? Intenté hacerlo lo mejor posible, pero no estoy seguro de qué significa el valor p. Como solo hay, esto es lo que pensé que podría significar. ¿Alguien puede aclarar las cosas?