¿Cuáles son las distribuciones en el cuadrante k-dimensional positivo con matriz de covarianza parametrizable?

Siguiendo la pregunta de zzk sobre su problema con las simulaciones negativas, me pregunto cuáles son las familias parametrizadas de distribuciones en el cuadrante k-dimensional positivo, para el cual se puede establecer la matriz de covarianza . $\mathbb{R}_+^k$ $\Sigma$

Como se discutió con zzk , comenzar desde una distribución en y aplicar la transformación lineal no funciona. $\mathbb{R}_+^k$ $X \longrightarrow\Sigma^{1/2} (X-\mu) + \mu$

distributions multivariate-analysis covariance

— Xi'an
fuente

Respuestas:

Supongamos que tenemos un vector aleatorio normal multivariado con y matriz completa positiva simétrica de rango completo .

(\log X_{1}, \dots, \log X_{k}) \sim N (μ, Σ),

$(\log X_1,\dots,\log X_k) \sim N(\mu,\Sigma) \, ,$

μ \in R^{k}

$\mu\in\mathbb{R}^k$

k \times k

$k\times k$

Σ = (σ_{i j})

$\Sigma=(\sigma_{ij})$

Para lognormal no es difícil demostrar que $(X_1,\dots,X_k)$

m_{i} := E [X_{i}] = e^{μ_{i} + σ_{i i} / 2}, i = 1, \dots, k,

$m_i := \textrm{E}[X_i] = e^{\mu_i + \sigma_{ii}/2} \, , \quad i=1,\dots,k\, ,$

c_{i j} := Cov [X_{i}, X_{j}] = m_{i} m_{j} (e^{σ_{i j}} - 1), i, j = 1, \dots, k,

$c_{ij} := \textrm{Cov}[X_i,X_j] = m_i \,m_j \,(e^{\sigma_{ij}} - 1) \, , \quad i,j=1,\dots,k\, ,$

y se deduce que . $c_{ij}>-m_im_j$

Por lo tanto, podemos hacer la pregunta inversa: dado y matriz simétrica positiva definida , satisfaciendo , si dejamos tendremos un vector lognormal con los medios y covarianzas prescritos. $m=(m_1,\dots,m_k)\in\mathbb{R}^k_+$ $k\times k$ $C=(c_{ij})$ $c_{ij}>-m_im_j$

μ_{i} = \log m_{i} - \frac{1}{2} \log (\frac{c_{i i}}{m_{i}^{2}} + 1), i = 1, \dots, k,

$\mu_i = \log m_i - \frac{1}{2} \log\left(\frac{c_{ii}}{m_i^2} + 1 \right) \, , \quad i=1,\dots,k \, ,$

σ_{i j} = \log (\frac{c_{i j}}{m_{i} m_{j}} + 1), i, j = 1, \dots, k,

$\sigma_{ij} = \log\left(\frac{c_{ij}}{m_i m_j} + 1 \right) \, , \quad i,j=1,\dots,k \, ,$

La restricción en y es equivalente a la condición natural . $C$ $m$ $\textrm{E}[X_i X_j]>0$

— zen
fuente

¡Estupendo, Paulo! Obtuviste tanto una solución de trabajo como la condición adecuada en la matriz de covarianza, que también responde a esta pregunta . Los log-normales resultan más prácticos que los gammas, al final.

— Xi'an

En realidad, tengo una solución definitivamente peatonal.

Comience con y elija los dos parámetros para que se ajusten a los valores de , . $X_1\sim \text{Ga}(\alpha_{11},\beta_{1})$ $\mathbb{E}[X_1]$ $\text{var}(X_1)$
Tome y elija los tres parámetros para que se ajusten a los valores de , y . $X_2|X_1\sim \text{Ga}(\alpha_{21}X_1+\alpha_{22},\beta_{2})$ $\mathbb{E}[X_2]$ $\text{var}(X_2)$ $\text{cov}(X_1,X_2)$
Tome y elija los cuatro parámetros para que se ajusten a los valores de , , y . $X_3|X_1,X_2\sim \text{Ga}(\alpha_{31}X_1+\alpha_{32}X_2+\alpha_{33},\beta_{3})$ $\mathbb{E}[X_3]$ $\text{var}(X_3)$ $\text{cov}(X_1,X_3)$ $\text{cov}(X_2,X_3)$

y así sucesivamente ... Sin embargo, dadas las restricciones sobre los parámetros y la naturaleza no lineal de las ecuaciones de momento, puede ser que algunos conjuntos de momentos no correspondan a ningún conjunto aceptable de parámetros.

Por ejemplo, cuando , termino con el sistema de ecuaciones $k=2$

β_{1} = μ_{1} / σ_{1}^{2}, α_{11} - μ_{1} β_{1} = 0

$\beta_1 =\mu_1/\sigma_1^2\,,\quad \alpha_{11}-\mu_1\beta_1 =0$

α_{22} = μ_{2} β_{2} - α_{21} μ_{1}, α_{21} = \frac{(σ_{12} + μ_{1} μ_{2} - μ_{2})}{σ_{1}^{2} + μ_{1}^{2} - μ_{1}} β_{2}

$\alpha_{22} = \mu_2\beta_2 - \alpha_{21}\mu_1\,,\quad \alpha_{21} = \dfrac{(\sigma_{12}+\mu_1\mu_2-\mu_2)}{\sigma^2_1+\mu_1^2- \mu_1}\beta_2$

\frac{(σ_{12} + μ_{1} μ_{2} - μ_{2})^{2}}{(σ_{1}^{2} + μ_{1}^{2} - μ_{1})^{2}} σ_{1}^{2} + \frac{μ_{2}}{β_{2}} = σ_{2}^{2} .

$\dfrac{(\sigma_{12}+\mu_1\mu_2-\mu_2)^2}{(\sigma^2_1+\mu_1^2- \mu_1)^2} \sigma_1^2 + \dfrac{\mu_2}{\beta_2} = \sigma^2_2\,.$ Ejecutar un código R con valores arbitrarios (y a priori aceptables) para y condujo a muchos casos sin solución. Nuevamente, esto no significa mucho porque las matrices de correlación para distribuciones en pueden tener restricciones más fuertes que un simple determinante positivo.

μ

$\mu$

Σ

$\Sigma$

R_{+}^{2}

$\mathbb{R}_+^2$

actualización (04/04): deinst reformuló esta pregunta como una nueva pregunta en el foro de matemáticas.

— Xi'an
fuente

Una forma de extender ligeramente esto es considerar la familia exponencial natural Luego la media y de covarianza son el gradiente y Hessian de . Si es un polinomio (con exponentes reales> -1), entonces es el logaritmo de un polinomio (con exponentes reales), y la varianza y la arpillera son funciones racionales. Creo que esto da suficiente libertad para representar cualquier matriz de media y covarianza.

f (X | θ) = h (x) e^{θ^{T} X - A (θ)} .

$f(\mathbf{X}|\mathbf\theta)=h(\mathbf{x})e^{\mathbf\theta^T\mathbf{X}-A(\mathbf\theta)}.$

A

$A$

h

$h$

A

$A$

— Deinst

@deinst: (+1) ¿Tiene un ejemplo en el que esta representación familiar exponencial pueda explotarse directamente?

— Xi'an

Quizás no entiendo bien el problema. Pero, considere un vector aleatorio bivariado con el mismo marginal con soporte completo en y que tenga una media de . ¿Cómo puede una distribución bivariada tener una correlación cercana a -1, por ejemplo? Heurísticamente, aunque no lo he llevado a cabo, parece que si , debe surgir una contradicción con respecto al soporte. ¿No?

(X, Y)

$(X,Y)$

F

$F$

R_{+}

$\mathbb R_{+}$

0 < μ < \infty

$0 < \mu < \infty$

ρ

$\rho$

P (X > 2 μ) > 0

$\mathbb P(X > 2 \mu) > 0$

— cardenal

Ciertamente, existen restricciones en la matriz de covarianza cuando el soporte es , cubierto a través de la condición de momento Stieltjes . De todos modos, no veo por qué una correlación cercana a -1 se excluye a priori .

Σ

$\Sigma$

R_{+}^{k}

$\mathbb{R}^k_+$

— Xi'an

Bien, esto está relacionado con lo que estaba llegando. Con respecto a la correlación, considere mi ejemplo. Si e tienen el mismo marginal con media y una correlación de exactamente -1 y , ¿cuál debe ser el valor de para todas esas realizaciones de ? (+1 en ambas preguntas y respuestas. Me gusta esto.)

X

$X$

Y

$Y$

F

$F$

μ

$\mu$

P (X > 2 μ) > 0

$\mathbb P(X > 2 \mu) > 0$

Y

$Y$

X

$X$

— cardenal

OK, esta es una respuesta al comentario de Xi'an. Es demasiado largo y tiene mucho TeX para ser un comentario cómodo. Advertencia Lector: Es prácticamente seguro que he cometido un error de álgebra. Esto no parece ser tan flexible como pensé al principio.

Creemos una familia de distribuciones en de la forma Sea y . Deje será un polinomio de dos términos donde son números reales mayores que 0 para todo . Entonces encontramos que $\mathbb{R}_+^3$

f (x | θ) = h (x) e^{- θ^{T} x - A (θ)}

$f(\mathbf{x}|\mathbf\theta)=h(\mathbf{x})e^{-\mathbf\theta^T\mathbf{x}-A(\mathbf\theta)}$

x = (x, y, z)

$\mathbf{x}=(x,y,z)$

θ = (θ_{1}, θ_{2}, θ_{3})

$\mathbf\theta=(\theta_1,\theta_2,\theta_3)$

h (x) = c x_{1}^{e_{1} - 1} x_{2}^{e_{2} - 1} x_{3}^{e_{3} - 1} + d x_{1}^{f_{1} - 1} x_{2}^{f_{2} - 1} x_{3}^{f_{3} - 1}

$h(\mathbf{x})=c x_1^{e_1-1}x_2^{e_2-1}x_3^{e_3-1}+d x_1^{f_1-1}x_2^{f_2-1}x_3^{f_3-1}$

e_{i}, f_{i}

$e_i, f_i$

i

$i$

A (θ) = \log (c \frac{Γ (e_{1})}{θ_{1}^{e_{1}}} \frac{Γ (e_{2})}{θ_{2}^{e_{2}}} \frac{Γ (e_{3})}{θ_{3}^{e_{3}}} + d \frac{Γ (f_{1})}{θ_{1}^{f_{1}}} \frac{Γ (f_{2})}{θ_{2}^{f_{2}}} \frac{Γ (f_{3})}{θ_{3}^{f_{3}}}) .

$A(\mathbf\theta)=\log\left(c\frac{\Gamma(e_1)}{\theta_1^{e_1}}\frac{\Gamma(e_2)}{\theta_2^{e_2}}\frac{\Gamma(e_3)}{\theta_3^{e_3}}+d\frac{\Gamma(f_1)}{\theta_1^{f_1}}\frac{\Gamma(f_2)}{\theta_2^{f_2}}\frac{\Gamma(f_3)}{\theta_3^{f_3}}\right).$

Ahora, por conveniencia, definamos y

c^{'} = c Γ (e_{1}) Γ (e_{2}) Γ (e_{2}) θ_{1}^{f_{1}} θ_{2}^{f_{2}} θ_{3}^{f_{3}}

$c'=c\Gamma(e_1)\Gamma(e_2)\Gamma(e_2)\theta_1^{f_1}\theta_2^{f_2}\theta_3^{f_3}$

d^{'} = d Γ (f_{1}) Γ (f_{2}) Γ (f_{2}) θ_{1}^{e_{1}} θ_{2}^{e_{2}} θ_{3}^{e_{3}}

$d'=d\Gamma(f_1)\Gamma(f_2)\Gamma(f_2)\theta_1^{e_1}\theta_2^{e_2}\theta_3^{e_3}$

Ahora, como la media de nuestra distribución es el gradiente de , tenemos , , y . Y como la covarianza es la arpillera de , tenemos y (los otros términos de la matriz de covarianza obtenidos al cambiar los subíndices de la manera obvia). $A$ $\mu_X=\frac{e_1c'+f_1d'}{\theta_1(c'+d')}$ $\mu_Y=\frac{e_2c'+f_2d'}{\theta_2(c'+d')}$ $\mu_Z=\frac{e_3c'+f_3d'}{\theta_3(c'+d')}$ $A$

σ_{X}^{2} = \frac{(e_{1} c^{'} + f_{1} d^{'}) (c^{'} + d^{'}) + (e_{1} - f_{1})^{2} c^{'} d^{'}}{θ_{1}^{2} (c^{'} + d^{'})^{2}}

$\sigma_X^2=\frac{(e_1c'+f_1d')(c'+d')+(e_1-f_1)^2c'd'}{\theta_1^2(c'+d')^2}$

Cov (X, Y) = \frac{(e_{1} - f_{1}) (e_{2} - f_{2}) c^{'} d^{'}}{θ_{1} θ_{2} (c^{'} + d^{'})}

$\text{Cov}(X,Y)=\frac{(e_1-f_1)(e_2-f_2)c'd'}{\theta_1\theta_2(c'+d')}$

Esto no parece ser suficiente flexibilidad para obtener una matriz de covarianza. Necesito probar otro término en el polinomio (pero sospecho que también puede no funcionar (obviamente necesito pensar más en esto)).

— deinst
fuente

¿Cuatro parámetros para cinco restricciones ...?

(θ_{1}, θ_{2}, θ_{3}, c)

$(\theta_1,\theta_2,\theta_3,c)$

— Xi'an

@xian También están los 6 exponentes y .

e_{i}

$e_i$

f_{i}

$f_i$

— deinst 01 de

Estoy un poco (?) Confundido: no procesaste los exponentes como parámetros de la familia exponencial. Pero, de hecho, puede cambiar esos poderes como desee para obtener las ecuaciones de 9 momentos correctas.

— Xi'an

@ Xi'an Tienes razón, no los procesé como parámetros de la familia exponencial. Si lo hiciera, la familia ya no sería una familia natural, e incluirlos simplemente habría confundido el álgebra para comentar las ecuaciones de momento (que para empezar era lo suficientemente confusa).

— deinst