Estoy tratando de usar el método ddply para tomar un dataframe con información diversa sobre 3000 películas y luego calcular la media bruta de cada género. Soy nuevo en R, y he leído todas las preguntas aquí relacionadas con ddply, pero todavía no puedo hacerlo bien. Esto es lo que tengo ahora:R: usando ddply para aplicar funciones a subconjuntos de datos
> attach(movies)
> ddply(movies, Genre, mean(Gross))
Error in llply(.data = .data, .fun = .fun, ..., .progress = .progress, :
.fun is not a function.
¿Cómo se supone que voy a escribir una función que toma la media de los valores en la columna "bruto" para cada conjunto de películas, agrupados por géneros? Sé que parece una pregunta simple, pero la documentación es realmente confusa para mí, y aún no estoy muy familiarizado con la sintaxis de R.
¿Hay algún otro método además de ddply que lo haga más fácil?
Gracias!
¿ha realizado algún preprocesamiento de los datos? El conjunto de datos de películas no contiene los nombres de columna "Bruto" ni "Género". Hay un conjunto de indicadores binarios que indican los diferentes géneros, y una columna de presupuesto ... http: //had.co.nz/data/movies/ – Chase
Además, no use adjuntar. – hadley