El archivo dat tiene algunas líneas de información adicional antes de los datos reales. Saltar con el argumento skip
:
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)
Una manera fácil de comprobar esto si no está familiarizado con el conjunto de datos es utilizar primero readLines
para comprobar unas pocas líneas, de la siguiente manera:
readLines("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
n=10)
# [1] "Ozone data from CZ03 2009" "Local time: GMT + 0"
# [3] "" "Date Hour Value"
# [5] "01.01.2009 00:00 34.3" "01.01.2009 01:00 31.9"
# [7] "01.01.2009 02:00 29.9" "01.01.2009 03:00 28.5"
# [9] "01.01.2009 04:00 32.9" "01.01.2009 05:00 20.5"
Aquí, podemos ver que los datos reales comienzan en [4]
, por lo que sabemos omitir las tres primeras líneas.
actualización
Si realmente solo querían la columna de la Value
, que podría hace eso por:
as.vector(
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)$Value)
Una vez más, readLines
es útil para ayudarnos a averiguar el nombre real de la columnas que estaremos importando.
Pero no veo mucho ventaja de hacerlo sobre leer todo el conjunto de datos y extraer más tarde.
+1 para [ejemplo reproducible] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example). – Andrie