Tengo un dataframe
y me gustaría aplicar una función que tome los valores de tres columnas y calcule la diferencia mínima entre los tres valores.use varias columnas como variables con sapply
#dataset
df <- data.frame(a= sample(1:100, 10),b = sample(1:100, 10),c= sample(1:100, 10))
#function
minimum_distance <- function(a,b,c)
{
dist1 <- abs(a-b)
dist2 <- abs(a-c)
dist3 <- abs(b-c)
return(min(dist1,dist2,dist3))
}
Busco algo como:
df$distance <- sapply(df, function(x) minimum_distance(x$a,x$b,x$c))
## errormessage
Error in x$a : $ operator is invalid for atomic vectors
Mientras que puedo utilizar ddply:
df2 <- ddply(df,.(a),function(r) {data.frame(min_distance=minimum_distance(r$a,r$b, r$c))}, .drop=FALSE)
Esto no impide que todas las columnas. ¿Alguna sugerencia?
Edit: terminó usando:
df$distance <- mapply(minimum_distance, df$a, df$b, df$c)
simple y elegante. gracias – zach
¿Cuál es el más rápido? o más eficiente? – Bharath