Simular a partir de una mezcla truncada distribución normal

Quiero simular una muestra de una mezcla de distribución normal de manera que

p \times N (μ_{1}, σ_{1}^{2}) + (1 - p) \times N (μ_{2}, σ_{2}^{2})

$p\times\mathcal{N}(\mu_1,\sigma_1^2) + (1-p)\times\mathcal{N}(\mu_2,\sigma_2^2)$

está restringido al intervalo $[0,1]$ en vez de $\mathbb{R}$ . Esto significa que quiero simular una mezcla truncada de distribuciones normales.

Sé que hay algunos algoritmos para simular una normal truncada (es decir, de esta pregunta ) y el paquete correspondiente en R para hacer esto. Pero, ¿cómo puedo simular una mezcla truncada normal? ¿Es lo mismo si simulo dos normales truncadas de $\mathcal{N}(\mu_1,\sigma_1^2)$ y $\mathcal{N}(\mu_2,\sigma_2^2$ ) para normalizar una mezcla truncada?

— Alexy
fuente

Si está en el intervalo de la unidad, ¿por qué no usar betas en lugar de normales? por

α = β > 1

$\alpha=\beta>1$ , la distribución es simétrica y unimodal y está limitada en el intervalo unitario.

— Sycorax dice Reinstate Monica

Si no necesita que sus simulaciones sean muy rápidas, puede hacerlo utilizando el muestreo de rechazo: (1) muestra

x

$x$ de la mezcla de dos normales, (2) si

x

$x$ no está dentro

[0, 1]

$[0,1]$ , regrese al paso 1, (3) salida

x

$x$ . (pero user777 tiene razón, ¿tiene una buena razón para elegir esta distribución en lugar de una mezcla de betas?)

— Elvis

@ user777 una mezcla gaussiana truncada tiene una distribución diferente de una distribución Beta y no se puede cambiar solo porque puede imponer la simetría y el mismo soporte.

— mjnichol

La simulación de una normal truncada se realiza fácilmente si tiene acceso a una función cuantil normal adecuada. Por ejemplo, en R, simulando

N_{a}^{b} (μ, σ^{2})

$\mathcal{N}_a^b(\mu,\sigma^2)$ dónde

a

$a$ y

b

$b$ denotar los límites inferior y superior se puede hacer invirtiendo el cdf

\frac{Φ (σ^{- 1} {x - μ}) - Φ (σ^{- 1} {a - μ})}{Φ (σ^{- 1} {b - μ}) - Φ (σ^{- 1} {a - μ})}

$\dfrac{\Phi(\sigma^{-1}\{x-\mu\})-\Phi(\sigma^{-1}\{a-\mu\})}{\Phi(\sigma^{-1}\{b-\mu\})-\Phi(\sigma^{-1}\{a-\mu\})}$ por ejemplo, en R

x = mu + sigma * qnorm( pnorm(a,mu,sigma) + 
     runif(1)*(pnorm(b,mu,sigma) - pnorm(a,mu,sigma)) )

De lo contrario, desarrollé un algoritmo de aceptación-rechazo normal truncado hace veinte años.

Si consideramos el problema de la mezcla truncada, con densidad

f (x; θ) \propto {p φ (x; μ_{1}, σ_{1}) + (1 - p) φ (x; μ_{2}, σ_{2})} I_{[a, b]} (x)

$f(x;\theta) \propto \left\{p\varphi(x;\mu_1,\sigma_1)+(1-p)\varphi(x;\mu_2,\sigma_2)\right\}\mathbb{I}_{[a,b]}(x)$ Es una mezcla de distribuciones normales truncadas pero con diferentes pesos :

f (x; θ) \propto p {Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} \frac{σ_{1}^{- 1} ϕ (σ_{1}^{- 1} {x - μ_{1}})}{Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} + (1 - p) {Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{2}^{- 1} {a - μ_{2}})} \frac{σ_{2}^{- 1} ϕ (σ_{2}^{- 1} {x - μ_{2}})}{Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{1}^{- 1} {a - μ_{2}})}

$f(x;\theta) \propto p\left\{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\}) \right\}\dfrac{\sigma_1^{-1}\phi(\sigma_1^{-1}\{x-\mu_1\})}{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\})} \\[15pt] +(1-p)\left\{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_2^{-1}\{a-\mu_2\}) \right\}\dfrac{\sigma_2^{-1}\phi(\sigma_2^{-1}\{x-\mu_2\})}{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_1^{-1}\{a-\mu_2\})}$ Por lo tanto, para simular a partir de una mezcla normal truncada, es suficiente tomar

x = {\begin{cases} x_{1} \sim N_{a}^{b} (μ_{1}, σ_{1}^{2}) & with probability \\ p {Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} / s \\ x_{2} \sim N_{a}^{b} (μ_{2}, σ_{2}^{2}) & with probability \\ (1 - p) {Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{2}^{- 1} {a - μ_{2}})} / s \end{cases}

$x=\begin{cases} x_1\sim\mathcal{N}_a^b(\mu_1,\sigma_1^2) &\text{with probability }\\ &\qquad p\left\{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\}) \right\}\big/\mathfrak{s}\\ x_2\sim\mathcal{N}_a^b(\mu_2,\sigma_2^2) &\text{with probability }\\ &\qquad(1-p)\left\{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_2^{-1}\{a-\mu_2\}) \right\}\big/\mathfrak{s} \end{cases}$ dónde

\begin{aligned} s = & p {Φ (σ_{1}^{- 1} {b - μ_{1}}) - Φ (σ_{1}^{- 1} {a - μ_{1}})} + \\ (1 - p) {Φ (σ_{2}^{- 1} {b - μ_{2}}) - Φ (σ_{2}^{- 1} {a - μ_{2}})} \end{aligned}

$\begin{align} \mathfrak{s}=&p\left\{\Phi(\sigma_1^{-1}\{b-\mu_1\})-\Phi(\sigma_1^{-1}\{a-\mu_1\}) \right\}+ \\ &(1-p)\left\{\Phi(\sigma_2^{-1}\{b-\mu_2\})-\Phi(\sigma_2^{-1}\{a-\mu_2\}) \right\} \end{align}$

— Xi'an
fuente

¿Por qué no podemos simplemente extraer la muestra de la primera normal con probabilidad p y la segunda distribución con probabilidad 1 - p?

— mjnichol

Ah! Creo que veo el problema. Es porque toda la distribución se está truncando, no cada distribución por separado. Si cada subdistribución de la mezcla se truncara individualmente antes de agregarse a la mezcla, entonces podríamos simplemente tomar muestras de la distribución de acuerdo con los pesos relativos de cada subdistribución, ¿verdad?

— mjnichol

@mjnichol Es una mezcla pero con pesos diferentes a

p

$p$ y

1 - p

$1-p$ .

— Xi'an

@ Xi'an: Supongamos que consideramos una configuración ligeramente diferente: ¿qué pasaría si en lugar de construir la distribución de la mezcla a partir de gaussianos ponderados y luego truncar, en su lugar, mezclamos dos gaussianos ya truncados (con el mismo soporte). Si los gaussianos se truncaran antes de mezclar, ¿podríamos tomar muestras de la distribución mediante el muestreo del primer gaussiano truncado con probabilidad p y el segundo con probabilidad 1 - p?

— mjnichol

@mjnichol: en ese caso, tendrías

p N_{a}^{b} (μ_{1}, σ_{1}^{2}) + (1 - p) N_{a}^{b} (μ_{2}, σ_{2}^{2})

$p\mathcal{N}_a^b(\mu_1,\sigma_1^2)+(1-p)\mathcal{N}_a^b(\mu_2,\sigma_2^2)$ así que sí, de hecho, esto funcionaría.

— Xi'an