Visualice la distribución binomial bivariada


11

Pregunta: ¿cómo se ve una distribución binomial bivariada en el espacio tridimensional?

A continuación se muestra la función específica que me gustaría visualizar para varios valores de los parámetros; a saber, , y .p 1 p 2np1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

Tenga en cuenta que hay dos restricciones; y . Además, es un número entero positivo, digamos, .p 1 + p 2 = 1 n 5x1+x2=np1+p2=1n5

En han hecho dos intentos de trazar la función usando LaTeX (TikZ / PGFPLOTS). Al hacerlo, obtengo los siguientes gráficos para los siguientes valores: , y , y, , y , respectivamente. No he tenido éxito en implementar la restricción en los valores del dominio; , así que estoy un poco perplejo.p 1 = 0.1 p 2 = 0.9 n = 5 p 1 = 0.4 p 2 = 0.6 x 1 + x 2 = nn=5p1=0.1p2=0.9n=5p1=0.4p2=0.6x1+x2=n

Una visualización producida en cualquier lenguaje estaría bien (R, MATLAB, etc.), pero estoy trabajando en LaTeX con TikZ / PGFPLOTS.

Primer intento

p 1 = 0.1 p 2 = 0.9n=5 , yp1=0.1p2=0.9

ingrese la descripción de la imagen aquí

Segundo intento

n=5 , yp 2 = 0.6p1=0.4p2=0.6

ingrese la descripción de la imagen aquí

Editar:

Como referencia, aquí hay un artículo que contiene algunos gráficos. El título del artículo es "Una nueva distribución binomial bivariada" de Atanu Biswasa y Jing-Shiang Hwang. Estadísticas y cartas de probabilidad 60 (2002) 231–240.

Edición 2: para mayor claridad, y en respuesta a @GlenB en los comentarios, a continuación se muestra una instantánea de cómo se me presentó la distribución en mi libro. El libro no se refiere a casos degenerados / no degenerados, etc. Simplemente lo presenta así y busqué visualizarlo. ¡Salud! Además, como señaló @JohnK, es probable que haya un error tipográfico con respecto a x1 + x1 = 1, que sugiere que debería ser x1 + x1 = n.

ingrese la descripción de la imagen aquí

Imagen de la ecuación de:

Spanos, A (1986) Fundamentos estadísticos del modelado econométrico. Prensa de la Universidad de Cambridge


55
Pero no debería ser un continuo, ¿verdad? Ambas variables aleatorias son discretas.
JohnK

1
Entonces x1 y x2 son independientes, ¿es así? ¿Necesitas una trama pseudo-3D? ¿Sería aceptable un mapa de calor?
gung - Restablece a Monica


2
@JohnK Si y estás tratando con (y es simplemente ). Este es un binomio univariado (o, considerado como bivariado, es degenerado ). x1+x2=np1+p2=1X1Binomial(n,p1)X2nX1
Glen_b -Reinstale a Mónica el

3
No tiene una especificación para un binomio bivariado en su pregunta. (Hay más de una forma de especificar una distribución bivariada que podría llamarse "binomial". No tiene ninguna de ellas, aunque su degenerada sería un caso especial de algunas de ellas) ... los dibujos en su referencia de Biswasa y Hwang no son pantallas adecuadas de un PMF bivariado discreto. En resumen, su pregunta no tiene nada que dibujar, y su referencia es útil principalmente como un ejemplo de qué evitar.
Glen_b -Reinstala a Mónica el

Respuestas:


8

Hay dos partes en esto: primero debe averiguar cuáles son las probabilidades individuales, luego debe trazarlas de alguna manera.

Un PMF binomial es solo un conjunto de probabilidades sobre una serie de 'éxitos'. Un PMF binomial bivariado será un conjunto de probabilidades sobre una cuadrícula de posibles combinaciones de 'éxitos'. En su caso, tiene , por lo que (teniendo en cuenta que éxitos es una posibilidad) hay resultados posibles en la distribución binomial cuadrícula / bivariada. ni=nj=506×6=36

Primero podemos calcular los PMF binomiales marginales, porque eso es muy sencillo. Como las variables son independientes, cada probabilidad conjunta será solo el producto de las probabilidades marginales; Esto es álgebra matricial. Aquí demuestro este proceso usando el Rcódigo:

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

En este punto, tenemos las dos matrices de probabilidades requeridas. Solo tenemos que decidir cómo queremos trazarlos. Para ser honesto, no soy un gran fanático de los gráficos de barras 3D. Porque Rparece estar de acuerdo conmigo, hice estas tramas en Excel:

b19:

ingrese la descripción de la imagen aquí

b46:

ingrese la descripción de la imagen aquí


Gracias por la presentación más el código R. Esto me lleva a preguntar acerca de x1 + x2 = n. Si esta condición se cumple, ¿debería haber una sola línea de pilares como se presenta aquí: reference.wolfram.com/language/ref/MultinomialDistribution.html El gráfico de Wolfram que supongo es lo que @Glen_b ha denominado caso degenerado? ¿Esto significa que has presentado el caso no degenerado?
Graeme Walsh

1
GraemeWalsh, mi presentación no muestra un binomio bivariado donde x1 + x2 = n. Como @Glen_b discutió extensamente en los comentarios y su respuesta, realmente no lo llamaría una "distribución binomial bivariada" sin calificarlo. Además, significaría que x1 y x2 no son independientes, como dijiste en tu comentario de respuesta, sino que son totalmente dependientes. En verdad, no me di cuenta de que esta era una variante tan extraña (puedes culparme por no leer lo suficientemente de cerca). Como Glen_b mostró, esa versión sería una sola línea de pilares. Lo que presenté fue el caso no degenerado.
gung - Restablece a Monica

@gung Me gustan tus nuevas parcelas. Creo que su discusión cubre el caso degenerado muy bien ("necesita averiguar cuáles son las probabilidades individuales" realmente lo dice todo; los cálculos reales para el caso degenerado son triviales); Acabo de realizar esos cálculos triviales.
Glen_b -Reinstala a Mónica el

7

La respuesta de Gung es una buena respuesta para un binomio bivariado real, explicando bien los problemas (recomendaría aceptarlo como una buena respuesta a la pregunta del título, lo más probable es que sea útil para otros).

El objeto matemático que realmente presenta en su edición es realmente un binomio escalado univariante. Aquí no es el valor tomado por el conteo binomial sino por la proporción (el binomio dividido por ).x1n

Así que definamos las cosas correctamente. Tenga en cuenta que no se ofrece ninguna definición de la variable aleatoria, por lo que nos quedan algunas conjeturas.

Deje Tenga en cuenta que cuando damos una fórmula matemática para es necesario que valores puede tomar, por lo que . Deje , y tenga en cuenta que .Y1binomial(n,p1),P(Y1=y1)y1y1=0,1,...,nX1=Y1/nx1=0,16,26,...,1

Entonces la ecuación que da es el pmf para (observando que y ).P(X1=x1)x2=nx1p2=1p1

Para , se ve así:n=6,p1=0.3

ingrese la descripción de la imagen aquí

Podemos poner los valores de en el gráfico anterior con bastante facilidad, simplemente colocando un segundo conjunto de etiquetas debajo de los valores de igual a (quizás en un color diferente) para indicar el valor tomado por .x 1 1 - x 1 x 2x2x11x1x2

Podríamos considerarlo como un binomio bivariado degenerado (escalado):

ingrese la descripción de la imagen aquí

pero es un poco exagerado llamar realmente a lo que se define en el libro un binomio bivariado (ya que efectivamente es un binomio univariado).

En el supuesto de que alguien quiera generar un diagrama similar al 3D, este pequeño código (R) se acerca bastante al segundo diagrama anterior:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

(Necesita el scatterplot3dpaquete que contiene la función del mismo nombre).

Un binomio bivariado "verdadero" (no degenerado) tiene variación en ambas variables a la vez. Aquí hay un ejemplo de un tipo particular de binomio bivariado (no independiente en este caso). Recurrí a usar diferentes colores en la trama porque, de lo contrario, es demasiado fácil perderse en el bosque de "palos".

ingrese la descripción de la imagen aquí

Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

X1X2

n0nynz=Xx1=x2x1+x2=n

[1]: Hamdan, MA (1972),
"Expansión canónica de la distribución binomial bivariada con índices marginales desiguales"
International Statistical Review , 40 : 3 (diciembre), págs. 277-280


corr(X1,X2)=1

Glen_b. Muchas gracias. Señalar que el objeto matemático que presenté (¡que se me presentó!) Es un binomio bivariado degenerado (a escala) ha sido muy útil. No sabía esto desde el principio. Por último, una solicitud elemental! ¿Sería posible para usted ser explícito (por medio de la notación matemática) sobre cómo define un binomio bivariado verdadero o real? Eso sería útil, creo.
Graeme Walsh

1
Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z

1
X1X2

@Graeme ... planeo agregar algunos detalles más.
Glen_b -Reinstala a Mónica el

4

Mathematicaahora es bastante fuerte en tales cosas: tiene la solución de su problema directamente en la documentación . Con pequeñas adiciones, hice un modelo para jugar ( p = p1 = 0.4para una mejor presentación visual). Así es como se ve la interfaz y cómo se puede controlar.

ingrese la descripción de la imagen aquí

Retazo

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

Lo principal aquí es PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], que es autoexplicativo, creo. Multinomialsolo significa que puede tomar muchas distribuciones con cada una pide las variables respectivas. La forma simple es BinomialDistribution. Por supuesto, podría hacerlo manualmente, pero la regla es que si tiene una función incorporada, debe usarla.

Si necesita algunos comentarios sobre la estructura del código, por favor, hágamelo saber.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.