Tengo algunos archivos de datos delimitados muy grandes y Quiero procesar solo ciertas columnas en R sin tomar el tiempo y la memoria para crear un data.frame
para el todo el archivoFormas de leer solo seleccionar columnas de un archivo en R? (Un medio feliz entre `read.table` y` scan`?)
Las únicas opciones que conozco son read.table
que es muy derrochador cuando solo quiero un par de columnas o scan
que parece demasiado bajo para lo que quiero.
¿Hay una mejor opción, ya sea con R puro o quizás llamando a algún otro script de shell para hacer la extracción de columna y luego usar scan o read.table en su salida? (¿Qué lleva a la pregunta de cómo llamar a un script de shell y capturar su salida en R?).
Todo un conjunto de respuestas útiles aquí. Cualquiera de ellos sería útil para un contexto dado. El aceptado fue simplemente el más cercano a mi caso real e incluyó un fragmento de código. (Podría haber elegido a Dirk pero parece que ya tiene mucha reputación ;-)) –
La mejor respuesta es en una nueva pregunta http://stackoverflow.com/q/5788117/168747 – Marek