Dividir un vector de cadena en R

tengo el siguiente vector:Dividir un vector de cadena en R

tmp3 <- c("1500 2", "1500 1", "1510 2", "1510 1", "1520 2", "1520 1", "1530 2", 
"1530 1", "1540 2", "1540 1")

me gustaría simplemente retener el segundo número en cada uno de los átomos de este vector, por lo que sería el siguiente:

c(2,1,2,1,2,1,2,1,2,1)

Fuente

2009-11-04 Zak

¿Se puede aceptar una respuesta para marcar la pregunta como resuelta? – MERose

Hay probablemente una mejor manera, pero aquí hay dos enfoques con strsplit():

as.numeric(data.frame(strsplit(tmp3, " "))[2,]) 
as.numeric(lapply(strsplit(tmp3," "), function(x) x[2]))

El as.numer ic() puede no ser necesario si se puede usar caracteres ...

Fuente

2009-11-04 22:10:56 Shane

Esta es una solución elegante. Justo lo que estaba buscando. ¡Gracias! – Zak

Traté de usar su solución, pero en su lugar, utilizando la columna de un marco de datos y no funcionó de inmediato. Yo agregaría que para esos casos necesitas convertirlo en una lista. 'as.numeric (data.frame (strsplit (as.list (df $ columnx), "")) [2,]) ' – pedrosaurio

substr(x = tmp3, start = 6, stop = 6)

Siempre y cuando sus cadenas son siempre la misma longitud, esto debe hacer el truco.

(Y, por supuesto, usted no tiene que especificar los nombres de los argumentos - substr(tmp3, 6, 6) funciona bien, también)

Fuente

2009-11-04 22:32:58

Se podría utilizar en read.tabletextConnection:

X <- read.table(textConnection(tmp3))

continuación

> str(X) 
'data.frame': 10 obs. of 2 variables: 
$ V1: int 1500 1500 1510 1510 1520 1520 1530 1530 1540 1540 
$ V2: int 2 1 2 1 2 1 2 1 2 1

así que X$V2 es lo que necesita.

Fuente

2009-11-05 08:41:07 Marek

Esto debe hacerlo:

library(plyr) 
ldply(strsplit(tmp3, split = " "))[[2]]

Si necesita un vector numérico, utilice

as.numeric(ldply(strsplit(tmp3, split = " "))[[2]])

Fuente

2009-11-06 10:09:48 Paolo

Lo que creo que es la forma más elegante de hacer esto

>  res <- sapply(strsplit(tmp3, " "), "[[", 2)

Si necesita que sea un número entero

>  storage.mode(res) <- "integer"

Fuente

2009-11-06 21:54:46 ephpostfacto

También,' res <- as.numeric (sapply (...)) 'funciona también; 'storage.mode' es un poco aterrador – user295691

-1

Una forma más fácil para dividir 1 en la columna 2 columnas a través de data.table

require(data.table) 
data_ex = data.table(a = paste(sample(1:3, size=10, replace=TRUE),"-separate", sep="")) 
data_ex[, number:= unlist(strsplit(x=a, split="-"))[[1]], by=a] 
data_ex[, word:= unlist(strsplit(x=a, split="-"))[[2]], by=a ]

Fuente

2013-04-30 19:08:36 greenbooks

Depende un poco de qué tanto sus datos real coincida con el ejemplo de datos que has dado. Te está tratando de obtener todo tras el espacio, puede utilizar gsub:

gsub(".+\\s+", "", tmp3) 
[1] "2" "1" "2" "1" "2" "1" "2" "1" "2" "1"

Si usted está tratando de aplicar una norma más complicado que "tomar todo después de que el espacio", se necesita un expresión regular más complicada.

Fuente

2013-04-30 23:21:55 SchaunW

puede explicar esto ... – user3067923

la función' gsub' es para reemplazar las coincidencias de expresiones regulares con otra cosa. En este caso, usamos la expresión regular '. + \\ s +' y reemplazamos cualquier coincidencia que encontremos con la cadena vacía '" "'. La expresión regular se traduce como "Coincidir con cualquier cosa al principio, pero tiene que terminar con un espacio" (el espacio de caracteres se escribe como '\\ s') –

Otra opción es scan(). Para obtener el segundo valor, podemos usar un subconjunto lógico.

scan(text = tmp3)[c(FALSE, TRUE)] 
# [1] 2 1 2 1 2 1 2 1 2 1

Fuente

2015-07-29 19:11:52

Respuesta

Cuestiones relacionadas