Estoy analizando datos de un aerogenerador, normalmente este es el tipo de cosas que haría en Excel, pero la cantidad de datos requiere algo de servicio pesado. Nunca antes había usado R, por lo que estoy buscando algunos indicadores.R Idioma - ordenando datos en rangos; promediando; ignorar valores atípicos
Los datos consisten en 2 columnas velocidad del viento y la potencia , hasta ahora he llegado a la importación de los datos de un archivo CSV y dispersión de los dos trazados uno contra el otro.
Lo que me gustaría hacer a continuación es ordenar los datos en intervalos; por ejemplo, todos los datos donde WindSpeed están entre xey y luego encuentran el promedio de la potencia generada para cada rango y grafican la curva formada.
A partir de esta media, quiero recalcular el promedio basado en datos que se encuentra dentro de una de dos desviaciones estándar de la media (básicamente ignorando valores atípicos).
Cualquier puntero es apreciado.
Para aquellos que estén interesados, estoy tratando de crear un gráfico similar al this. Es un tipo de gráfico bastante estándar, pero como he dicho, la cantidad de datos de corte requiere algo más pesado que Excel.
Gracias Gavin esta es una solución mucho mejor. Sin embargo, no puedo hacerlo funcionar (1 Error, 1 Advertencia) – klonq
Error en eval (predvars, data, env): numérico 'envir' arg no de longitud uno – klonq
Causado por la línea pred <- predict (mod, x_grid, se.fit = TRUE) y seguido por el mensaje de advertencia: en predict.gam (mod, x_grid, se.fit = TRUE) : no todos requieren d las variables se han suministrado en newdata! (Estoy usando datos reales, no datos ficticios) – klonq