Utilicé el accesorio modelo para ajustar la distribución binomial negativa a mis datos discretos. Como paso final, parece que necesito realizar una prueba de Kolmogrov-Smirnov para determinar si el modelo se ajusta bien a los datos. Todas las referencias que pudieran encontrar charla sobre el uso de la prueba de normalmente distribuidoscontinuas datos. ¿Puede alguien decirme si esto se puede hacer en R para datos que no se distribuyen normalmente y son discretos? (Incluso una prueba de chi-cuadrado debería hacer yo supongo, pero por favor, corríjanme si me equivoco).Kolmogorov-Smirnov o una prueba de Chi-Cuadrado para una distribución?
ACTUALIZACIÓN:
Entonces me encontré con que el paquete contiene una función vcd
goodfit
que puede ser utilizado para este propósito de la siguiente manera:
library(vcd)
# Define the data
data <- c(67, 81, 93, 65, 18, 44, 31, 103, 64, 19, 27, 57, 63, 25, 22, 150,
31, 58, 93, 6, 86, 43, 17, 9, 78, 23, 75, 28, 37, 23, 108, 14, 137,
69, 58, 81, 62, 25, 54, 57, 65, 72, 17, 22, 170, 95, 38, 33, 34, 68,
38, 117, 28, 17, 19, 25, 24, 15, 103, 31, 33, 77, 38, 8, 48, 32, 48,
26, 63, 16, 70, 87, 31, 36, 31, 38, 91, 117, 16, 40, 7, 26, 15, 89,
67, 7, 39, 33, 58)
gf <- goodfit(data, type = "nbinomial", method = "MinChisq")
plot(gf)
Pero después del paso de gf <- ...
, R a reclamación diciendo:
Warning messages:
1: In pnbinom(q, size, prob, lower.tail, log.p) : NaNs produced
2: In pnbinom(q, size, prob, lower.tail, log.p) : NaNs produced
3: In pnbinom(q, size, prob, lower.tail, log.p) : NaNs produced
y cuando digo plot
se queja:
Error in xy.coords(x, y, xlabel, ylabel, log) :
'x' is a list, but does not have components 'x' and 'y'
No estoy seguro de lo que está pasando porque si fijo data
a ser las siguientes:
data <- <- rnbinom(200, size = 1.5, prob = 0.8)
todo funciona bien. ¿Alguna sugerencia?
Pertenece a http://stats.stackexchange.com/ – MSalters
plot (gf) funciona aquí (R 2.12.0, versión 1.2-9 de vcd). Use las opciones (warn = 2, error = recover) para convertir las advertencias en errores y luego inicie un navegador en warn/error. En algún punto del proceso de adaptación, R intenta hacer que el parámetro 'prob' de NB sea negativo ... f <- MASS :: fitdistr (datos, "binomio negativo"); diagrama (tabla (datos)/longitud (datos)); curva (dnbinom (x, tamaño = 2.354, mu = 50.8), de = 1, a = 170, n = 170, suma = VERDADERO, col = 2) indica que los datos son demasiado 'irregulares' para ajustarse bien a un NB. Comparando $ par en estos dos casos muestra que llega a respuestas razonablemente similares; las advertencias son probablemente ignorables –