Digamos que tengo una data.table y quiero seleccionar todas las filas donde la variable x tiene un valor de b. Eso es fácil¿Cómo selecciono las filas por dos criterios en data.table en R
library(data.table)
DT <- data.table(x=rep(c("a","b","c"),each=3), y=c(1,3,6), v=1:9)
setkey(DT,x) # set a 1-column key
DT["b"]
Por cierto, parece que uno tiene que establecer una clave, si la clave no está establecido en x, entonces esto no funciona. Por cierto, ¿qué pasaría si configuro dos columnas como claves?
De todos modos, se mueve a lo largo de, digamos que yo quiero para seleccionar todas las filas en las que la variable x era aob
DT["b"|"a"]
no funciona
Pero las siguientes obras
DT[x=="a"|x=="b"]
Pero eso usa el escaneo vectorial a los marcos de datos. No usa la búsqueda binaria. Supongo que para conjuntos de datos más pequeños no importará.
¿Eso es lo que debería hacer o no conozco la sintaxis de data.table?
Y una cosa más. ¿Hay algún ejemplo de procedimientos de selección (o subconjuntos) booleanos más complejos de variables múltiples con data.table?
Sé que siempre podría volver a utilizar la función subconjunto() ya que una data.table se comportará como un data.frame si es necesario.
En la viñeta de introducción se muestra un ejemplo detallado de la clave de varias columnas. –
Y no estoy seguro de qué tan conocido es trabajar con el resultado de 'example (data.table)' en el prompt - hay ejemplos. –