Al comparar diferentes submodelos, es necesario que estén instalados en el mismo conjunto de datos - de lo contrario los resultados simplemente no tienen sentido. (Tenga en cuenta la situación extrema en la que tiene dos predictores A
y B
, que se miden solo en la mitad de sus observaciones; luego, el modelo y~A+B
se ajustará a todos los datos, pero los modelos y~A
y y~B
se instalarán en no -superar subconjuntos de los datos.) Por lo tanto, step
no le permitirá comparar submodelos que (debido a la eliminación automática de casos que contienen NA
valores) están utilizando diferentes subconjuntos del conjunto de datos original.
El uso de na.omit
en el conjunto de datos original debería solucionar el problema.
fullmodel <- lm(Eeff ~ NDF + ADF + CP + NEL + DMI + FCM, data = na.omit(phuong))
step(fullmodel, direction = "backward", trace=FALSE)
Sin embargo, si usted tiene una gran cantidad de NA
valores en diferentes predictores, puede acabar perdiendo mucho de su conjunto de datos - en un caso extremo podría perder el conjunto de datos toda. Si esto sucede, debe reconsiderar su estrategia de modelado ...
Tengo una duda, ¿no tiene que poner el modelo completo en lugar de lleno en el paso (completo, dirección = "hacia atrás", rastreo = FALSO)? ¿Me equivoco? –
sí. Acabo de copiar el código del OP sin mirarlo demasiado cuidadosamente. Gracias. –
sí, funciona. Muchas gracias Ben Bolker por tus comentarios. –