Una variable binomial con n ensayos y probabilidad p de éxito en cada ensayo puede verse como la suma de n ensayos de Bernoulli que también tienen probabilidad p de éxito.
De manera similar, puede construir pares de variables binomiales correlacionadas por sumando parejas de variantes de Bernoulli que tienen la correlación deseada r.
require(bindata)
# Parameters of joint distribution
size <- 20
p1 <- 0.5
p2 <- 0.3
rho<- 0.2
# Create one pair of correlated binomial values
trials <- rmvbin(size, c(p1,p2), bincorr=(1-rho)*diag(2)+rho)
colSums(trials)
# A function to create n correlated pairs
rmvBinomial <- function(n, size, p1, p2, rho) {
X <- replicate(n, {
colSums(rmvbin(size, c(p1,p2), bincorr=(1-rho)*diag(2)+rho))
})
t(X)
}
# Try it out, creating 1000 pairs
X <- rmvBinomial(1000, size=size, p1=p1, p2=p2, rho=rho)
# cor(X[,1], X[,2])
# [1] 0.1935928 # (In ~8 trials, sample correlations ranged between 0.15 & 0.25)
Es importante tener en cuenta que hay muchos diferentes distribuciones conjuntas que comparten el coeficiente de correlación deseada. El método de simulación en rmvBinomial()
produce uno de ellos, pero si es el adecuado dependerá del proceso que genere sus datos.
Como se señaló en this R-help answer a una pregunta similar (que luego pasa a explicar la idea en más detalle):
mientras que un bivariados (medios dados y varianzas) normal se define de forma única por el coeficiente de correlación , este no es el caso para un binomio de dos variables
Usted puede utilizar el paquete 'bindata', como muy bien demo'd aquí: https://stat.ethz.ch/pipermail/r-help/2007-July/135575.html. (Ese enlace estaba en la primera página devuelta por una búsqueda en Google para 'R simular la variable binomial correlacionada' ...) –
Gracias Josh, ¡pero necesito datos binomiales no binarios! – Arnaud
@Arnaud - otorgada No he tenido ningún tipo de cafeína o estimulantes de esta mañana, pero no es una distribución binomial una distribución discreta, donde los únicos valores aceptables son "sí/no", "pasa/no pasa", "TRUE/FALSO ", en otras palabras, binario? Eso es lo que [Wikipedia parece pensar demasiado.] (Http://en.wikipedia.org/wiki/Binomial_distribution) – Chase