Esto se ilustra mejor con un ejemplo¿Estadísticas de resumen por dos o más variables de factor?
str(mtcars)
mtcars$gear <- factor(mtcars$gear, labels=c("three","four","five"))
mtcars$cyl <- factor(mtcars$cyl, labels=c("four","six","eight"))
mtcars$am <- factor(mtcars$am, labels=c("manual","auto")
str(mtcars)
tapply(mtcars$mpg, mtcars$gear, sum)
Eso me da la mpg resumió por engranajes. Pero digamos que quería una mesa de 3x3 con equipo en la parte superior y cyl en el costado, y 9 celdas con las sumas bivariadas, ¿cómo lo conseguiría 'inteligentemente'?
Podría ir.
tapply(mtcars$mpg[mtcars$cyl=="four"], mtcars$gear[mtcars$cyl=="four"], sum)
tapply(mtcars$mpg[mtcars$cyl=="six"], mtcars$gear[mtcars$cyl=="six"], sum)
tapply(mtcars$mpg[mtcars$cyl=="eight"], mtcars$gear[mtcars$cyl=="eight"], sum)
Esto parece engorroso.
Entonces, ¿cómo podría traer una tercera variable en la mezcla?
Esto es algo en el espacio en el que estoy pensando. Summary statistics using ddply
actualización Esto me lleva allí, pero no es bonito.
aggregate(mpg ~ am+cyl+gear, mtcars,sum)
Saludos
Esto parece ser la respuesta obvia, teniendo en cuenta que el punto de partida fue un solo factor. 'ftable' también podría ser de interés. –