La presente pregunta es un caso específico en el que se trata de una cantidad que es una función lineal de una variable aleatoria multinomial. Es posible resolver su problema exactamente, enumerando las combinaciones multinomiales que satisfacen la desigualdad requerida y sumando la distribución en ese rango. En el caso donde es grande, esto puede volverse computacionalmente inviable. En este caso, es posible obtener una distribución aproximada utilizando la aproximación normal al multinomio. A continuación se muestra una versión generalizada de esta aproximación, y luego se aplica a su ejemplo específico.N
Problema general de aproximación: supongamos que tenemos una secuencia de variables aleatorias intercambiables con rango . Para cualquier podemos formar el vector de recuento , que cuenta el número de ocurrencias de cada resultado en los primeros valores de la secuencia. Como la secuencia subyacente es intercambiable, el vector de recuento se distribuye como:1,2,...,mn∈NX≡X(n)≡(X1,X2,...,Xm)n
X ~ Mu(n,θ)θ=limn→∞X(n)/n.
Ahora, supongamos que tenemos algún vector de pesos no negativos y usamos estos pesos para definir la función lineal:w=(w1,w2,...,wm)
A(n)≡∑i=1mwiXi.
Como los pesos no son negativos, esta nueva cantidad no disminuye en . Luego definimos el número , que es el menor número de observaciones requerido para obtener un valor mínimo especificado para nuestra función lineal. Queremos aproximar la distribución de en el caso de que este valor sea (estocásticamente) grande.nN(a)≡min{n∈N|A(n)⩾a}N(a)
Resolviendo el problema general de aproximación: Primero, notamos que dado que no es decreciente en (lo cual se cumple porque hemos asumido que todos los pesos no son negativos), tenemos:A(n)n
P(N(a)⩾n)=P(N(a)>n−1)=P(A(n−1)<a).
Por lo tanto, la distribución de está directamente relacionada con la distribución de . Suponiendo que la primera cantidad es grande, podemos aproximar la distribución de la segunda reemplazando el vector aleatorio discreto con una aproximación continua de la distribución normal multivariada. Esto lleva a una aproximación normal para la cantidad lineal , y podemos calcular los momentos de esta cantidad directamente. Para hacer esto, usamos el hecho de que , y para . Con algo de álgebra básica, esto nos da:NAXA(n)E(Xi)=nθiV(Xi)=nθi(1−θi)C(Xi,Xj)=−nθiθji≠j
μ≡E(1nA(n))=∑i=1mwiθi,
σ2≡V(1n−−√A(n))=∑i=1mwiθi−(∑i=1mwiθi)2=μ(1−μ).
Tomar la aproximación normal al multinomio ahora nos da la distribución aproximada . Aplicando esta aproximación se obtienen:A(n) ~ N(nμ,nμ(1−μ))
P(N(a)⩾n)=P(A(n−1)<a)≈Φ(a−(n−1)μ(n−1)μ(1−μ)−−−−−−−−−−−−−√).
(El símbolo es la notación estándar para la función de distribución normal estándar). Es posible aplicar esta aproximación para encontrar probabilidades relativas a la cantidad para un valor específico de . Esta es una aproximación básica que no ha intentado incorporar la corrección de continuidad en los valores de los valores de recuento multinomiales subyacentes. Se obtiene tomando una aproximación normal usando los mismos dos primeros momentos centrales como la función lineal exacta.ΦN(a)a
Aplicación a su problema: en su problema tiene probabilidades , weights , y el valor de corte a . Por lo tanto, tiene (redondeando a seis puntos decimales) . Aplicando la aproximación anterior que tenemos (redondeando a seis puntos decimales):θ=(12,16,13)w=(0,ln2,ln3)a=ln100000μ=16ln2+13ln3=0.481729
P(N(a)⩾25)≈Φ(ln100000−24⋅0.48172924−−√⋅0.499666)=Φ(−0.019838)=0.492086.
Mediante la aplicación de la distribución multinomial exacta, sumando todas las combinaciones que satisfacen el requisito , se puede demostrar que el resultado exacto es . Por lo tanto, podemos ver que la aproximación es bastante cercana a la respuesta exacta en el presente caso.P(A(24)<a)P(N(a)⩾25)=0.483500
Con suerte, esta respuesta le dará una respuesta a su pregunta específica, al tiempo que la ubica dentro de un marco más general de resultados probabilísticos que se aplican a funciones lineales de vectores aleatorios multinomiales. El método actual debería permitirle obtener soluciones aproximadas a los problemas del tipo general que enfrenta, permitiendo la variación en los números específicos en su ejemplo.