Estoy seguro de que esta es una pregunta muy básica:En R, ¿cómo colapsar categorías o recategorizar variables?
En RI tienen 600.000 variables categóricas - cada uno de los cuales se clasifica como "0", "1" o "2"
Lo que le gustaría do es colapsar "1" y "2" y dejar "0" por sí mismo, de modo que después de volver a categorizar "0" = "0"; "1" = "1" y "2" = "1" --- al final solo quiero "0" y "1" como categorías para cada una de las variables.
Además, si es posible, prefiero no crear 600,000 nuevas variables, si puedo reemplazar las variables existentes con los nuevos valores que serían geniales.
¿Cuál sería la mejor manera de hacerlo?
Gracias!
Gracias por la respuesta! Así es como lo estoy aplicando específicamente a mis datos. Mis datos son en forma de un data.frame, que me gustaría mantener: data <- read.table ("k.csv", header = TRUE, sep = ",") dta <- data [ , 1: 30] col = dim (dta) [2] para (y en 1: col) { py <- factor (pmin (as.data.frame (dta [, y]), 2) , labels = c ("0", "1")) py } Por supuesto que resulta en un error - Estoy seguro de que no lo estoy aplicando correctamente – CCA