Cuando uso la función read.csv()
en R
para cargar datos, a menudo encuentro que se ha agregado una X a nombres de variables. Creo que casi siempre lo veo en la primera variable, pero podría estar equivocado.R- ¿Por qué se agregan las X a los nombres de las variables en mi marco de datos?
Al principio, pensé que R
podría estar haciendo esto porque tenía un espacio al comienzo del nombre de la variable - no es así.
En segundo lugar, leí en alguna parte que si tiene una variable que comienza con un número, o es un nombre de variable muy corto, R
agregaría la X. El nombre de la variable es todo el texto y la longitud del nombre de este la variable tiene 12 caracteres, por lo que no es corta.
Ahora, esto es puramente una molestia. Puedo cambiar el nombre de la columna, pero agrega un paso, aunque pequeño.
¿Hay alguna manera de evitar que esto del pícaro X se infiltre en mi marco de datos?
Aquí está mi código original:
df <- read.csv("/file/location.filecsv", header=T, sep=",")
Aquí es la variable en cuestión:
str(orders)
'data.frame': 2620276 obs. of 26 variables:
$ X.OrderDetailID : Factor w/ 2620193 levels "(2620182 row(s) affected)",..: 105845
Se puede publicar los nombres de las variables con las X y el código que se utiliza para leer los datos? –
Todavía no entiendo * por qué * esto está sucediendo. El hecho de que suceda (¿sobre todo?) Al primer nombre de variable me sugiere que de algún modo terminas con un personaje especial invisible al comienzo de tus archivos. –