Tengo un hoja.de.datos así:En R, ¿hay alguna forma de manejar NA en una columna entera de un data.frame para que los valores de NA no se incluyan al subconjunto?
(t=structure(list(count = c(NA, 2, NA, NA, NA, 8, NA, NA, NA)), .Names = "count", row.names = c(NA,-9L), class = "data.frame"))
count
1 NA
2 2
3 NA
4 NA
5 NA
6 8
7 NA
8 NA
9 NA
Es muy bueno que R tiene el valor NA pero a veces me muerdo. A menudo me olvido de esto y trato de hacer subconjuntos como este
> t[t$count>=1,]
[1] NA 2 NA NA NA 8 NA NA NA
Y la salida incluye todas las filas de NA. (Que no me gusta)
Después de una hora de búsqueda de errores que cambie el código para esto y eso es lo que yo quiero (imaginan gran trama de datos una gran cantidad de resultados mencionan los no-NA y sólo unos pocos "bien escondido "AN):
> t[t$count>=1&!is.na(t$count),]
[1] 2 8
1. ¿hay una característica de la "función as.integer" para que yo pudiera hacer algo como esto:
t [as.integer.EXCLUDE.NA (t $ count)> = 1,]
Me gustaría utilizar dicha función en otras funciones de .xxxx también. Básicamente, fuerce a R a dejar de pensar como un estadístico y tratar NA de manera diferente (por ejemplo, como NULL (no estoy seguro de que NULL resuelva mi problema) (esto no funcionó: t $ count [3] < -NULL por alguna razón)
2. o cómo iba a funcionar
transform(t, replace all NAs from count columns with 0)
o incluso mejor
transform(t, replace all NA from all numeric columns with 0 in t)
3. las observaciones genéricas sobre cómo hacer olvidar R AN son bienvenidos?
veo el valor de la AN, pero hay conjuntos de datos en AN no son bien recibidos. – userJT
Pero, ¿cómo quieres manejarlos? ¿Dejar cada NA? ¿Dejar cada fila donde hay NA? ¿Imputarlos? Es una decisión sustantiva. –