Estoy perplejo. Normalmente, read.csv
funciona como se esperaba, pero me he encontrado con un problema donde el comportamiento es inesperado. Lo más probable es que sea un error del usuario de mi parte, pero cualquier ayuda será apreciada.Read.CSV no funciona como se esperaba en R
Aquí está la dirección del archivo
http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip
Aquí está mi código para obtener el archivo, descomprimirlo, y leerlo en:
URL <- "http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip"
download.file(URL, destfile="temp.zip")
unzip("temp.zip")
tmp <- read.table("sfa0910.csv",
header=T, stringsAsFactors=F, sep=",", row.names=NULL)
Aquí es mi problema. Cuando abro los datos de csv de datos en Excel, los datos se ven como se esperaba. Cuando leo los datos en R, la primera columna se llama row.names. R está leyendo en una fila adicional de datos, pero no puedo entender dónde ocurre el "error" que está causando que row.names sea una columna. Simplemente, parece que los datos cambiaron.
Sin embargo, lo extraño es que la última columna en R parece contener los datos adecuados.
Éstos son un par de filas de las primeras columnas:
tmp[1:5,1:7]
row.names UNITID XSCUGRAD SCUGRAD XSCUGFFN SCUGFFN XSCUGFFP
1 100654 R 4496 R 1044 R 23
2 100663 R 10646 R 1496 R 14
3 100690 R 380 R 5 R 1
4 100706 R 6119 R 774 R 13
5 100724 R 4638 R 1209 R 26
alguna idea de lo que podría estar haciendo mal?
Nunca suponga que Excel representa correctamente el contenido de su archivo CSV. Abra el CSV en un editor de texto (no es que esta sea la causa de su problema, sino como una regla general). –
elimina el argumento 'row.names = NULL'. – mnel
@ttmaccer - es extraño, no necesita autenticarse en el sitio. Lo intenté desde la web y lo descargué automáticamente en mi computadora. Estoy usando Chrome. – Btibert3