No puede usar la representación lineal de la correlación en distribuciones de soporte discretas.
En el caso especial de la distribución binomial, la representación
X=∑i=18δiY=∑i=118γiδi,γi∼B(1,2/3)
puede ser explotado desde
cov(X,Y)=∑i=18∑j=118cov(δi,γj)
Si elegimos algunos de los
δies igual a algunos de los
γj's, y generados independientemente de lo contrario, obtenemos
cov(X,Y)=∑i=18∑j=118I(δi:=γj)var(γj)
donde la notación
I(δi:=γj) indica que
δi se elige idéntico a
γj en lugar de generarse como un Bernoulli
B(1,2/3).
Como la restricción es
cov(X,Y)=0.5×8×18−−−−−√×23×13
tenemos que resolver
∑i=18∑j=118I(δi:=γj)=0.5×8×18−−−−−√=6
Esto significa que si elegimos 6 de los 8
δies igual a 6 de los 18
γjDeberíamos obtener esta correlación de 0.5.
La implementación es la siguiente:
- Generar Z∼B(6,2/3), Y1∼B(12,2/3), X1∼B(2,2/3);
- Toma X=Z+Z1 y Y=Z+Y1
Podemos verificar este resultado con una simulación R
> z=rbinom(10^8,6,.66)
> y=z+rbinom(10^8,12,.66)
> x=z+rbinom(10^8,2,.66)
cor(x,y)
> cor(x,y)
[1] 0.5000539
Comentario
Esta es una solución bastante artificial al problema, ya que solo funciona porque 8×18 es un cuadrado perfecto y porque cor(X,Y)×8×18−−−−−√es un entero Para otras correlaciones aceptables, la aleatorización sería necesaria, es decirI(δi:=γj) sería cero o uno con alguna probabilidad ϱ.
Apéndice
El problema fue propuesto y resuelto hace años en Stack Overflow con la misma idea de compartir Bernoullis.