2012-01-26 170 views
29

Estoy intentando predecir un valor en R utilizando la función predict(), pasando variables al modelo.R: numérico 'envir' arg no de longitud uno en predict()

estoy consiguiendo el error siguiente:

Error in eval(predvars, data, env) : 
    numeric 'envir' arg not of length one 

Aquí es mi data frame, df nombre:

df <- read.table(text = ' 
    Quarter Coupon  Total 
1 "Dec 06" 25027.072 132450574 
2 "Dec 07" 76386.820 194154767 
3 "Dec 08" 79622.147 221571135 
4 "Dec 09" 74114.416 205880072 
5 "Dec 10" 70993.058 188666980 
6 "Jun 06" 12048.162 139137919 
7 "Jun 07" 46889.369 165276325 
8 "Jun 08" 84732.537 207074374 
9 "Jun 09" 83240.084 221945162 
10 "Jun 10" 81970.143 236954249 
11 "Mar 06" 3451.248 116811392 
12 "Mar 07" 34201.197 155190418 
13 "Mar 08" 73232.900 212492488 
14 "Mar 09" 70644.948 203663201 
15 "Mar 10" 72314.945 203427892 
16 "Mar 11" 88708.663 214061240 
17 "Sep 06" 15027.252 121285335 
18 "Sep 07" 60228.793 195428991 
19 "Sep 08" 85507.062 257651399 
20 "Sep 09" 77763.365 215048147 
21 "Sep 10" 62259.691 168862119', header=TRUE) 


str(df) 
'data.frame': 21 obs. of 3 variables: 
$ Quarter : Factor w/ 24 levels "Dec 06","Dec 07",..: 1 2 3 4 5 7 8 9 10 11 ... 
$ Coupon: num 25027 76387 79622 74114 70993 ... 
$ Total: num 132450574 194154767 221571135 205880072 188666980 ... 

Código:

model <- lm(df$Total ~ df$Coupon) 

> model 

Call: 
lm(formula = df$Total ~ df$Coupon) 

Coefficients: 
(Intercept) df$Coupon 
    107286259   1349 

Ahora, cuando corro predict, me obtener el error que mostré arriba.

> predict(model, df$Total, interval="confidence") 
Error in eval(predvars, data, env) : 
    numeric 'envir' arg not of length one 

Alguna idea de dónde voy mal?

Gracias

Respuesta

27

Hay varios problemas aquí:

  1. El argumento de newdatapredict() necesita una variable de predictor. Por lo tanto, debe pasar los valores para Coupon, en lugar de Total, que es la variable de respuesta en su modelo.

  2. La variable de predicción debe pasarse como una columna con nombre en un marco de datos, de modo que predict() sepa lo que representan los números que se le han entregado. (La necesidad de esto se vuelve clara cuando se consideran modelos más complicados, que tienen más de una variable de predicción).

  3. Para que esto funcione, su llamada original debe pasar df en el argumento data, en lugar de usarlo directamente en su fórmula. (De esta forma, el nombre de la columna en newdata podrá hacer coincidir el nombre en el RHS de la fórmula).

Con esos cambios incorporados, esto va a funcionar:

model <- lm(Total ~ Coupon, data=df) 
new <- data.frame(Coupon = df$Coupon) 
predict(model, newdata = new, interval="confidence") 
+5

+1 Ellos realmente no necesita para pasar los valores de 'Coupon' de la trama de datos original. Quizás realmente quieran predecir la respuesta en los valores de 'Total'. Pero esos valores tienen que estar en algo _named_ 'Coupon' para que coincida con el modelo. – joran

+2

@joran - gracias por hacer ese punto. Por lo general, deseará pasar los valores de 'Cupón 'que no sean los utilizados para ajustar el modelo. Y cuando ** quieres ** querer los valores predichos para los puntos en el modelo, puedes simplemente decir 'predecir (modelo, intervalo =" confianza ")' –

+0

@ JoshO'Brien Gracias por eso. Trabajó como un campeón. – mikebmassey

Cuestiones relacionadas