Digamos que tenemos un vector aleatorio , extraído de una distribución con función de densidad de probabilidad . Si lo transformamos linealmente por un rango completo matriz para obtener , entonces la densidad de viene dada porX⃗ ∈RnfX⃗ (x⃗ )n×nAY⃗ =AX⃗ Y⃗
fY⃗ (y⃗ )=1|detA|fX⃗ (A−1y⃗ ).
Ahora digamos que transformamos X⃗ lugar por una matriz m×n matriz B , con m>n , dando Z⃗ =BX⃗ . Claramente Z∈Rm , pero "vive" en un subespacio n dimensional G⊂Rm . ¿Cuál es la densidad condicional de Z⃗ , dado que sabemos que se encuentra en G ?
Mi primer instinto era utilizar la pseudo-inversa de B . Si B=USVT es la descomposición de valor singular de B , entonces B+=VS+UT es la pseudo-inversa, donde S+ se forma mediante la inversión de los no-cero entradas de la matriz diagonal S . Supuse que esto daría
fZ⃗ (z⃗ )=1∣∣det+S∣∣fX⃗ (B+z⃗ ),
donde por
det+S me refiero al producto de los valores singulares distintos de cero.
Este razonamiento concuerda con la densidad para una normal singular (condicionada por el conocimiento de que la variable vive en el subespacio apropiado) dada aquí y mencionada también aquí y en esta publicación CrossValidated .
¡Pero no está bien! La constante de normalización está desactivada. Se da un contraejemplo (trivial) considerando el siguiente caso: con X∼N(0,1) , deje
Y⃗ =(11)X=(XX).
Aquí la matriz
B de arriba es solo el vector unos. Su pseudo-inverso es
B+=(1/21/2)
y
det+B=2–√ . El razonamiento de arriba sugeriría
fY⃗ (y⃗ )=12π−−√2–√exp(−12y⃗ T(B+)TB+y⃗ ),
pero esto de hecho se integra (en la línea
y=x ) a
12√. Me doy cuenta de que, en este caso, podrías soltar una de las entradas de
Y⃗ hayas terminado, pero cuando
B es mucho más grande, identificar el conjunto de entradas para soltar es molesto. ¿Por qué no funciona el razonamiento pseudo-inverso? ¿Existe una fórmula general para la función de densidad de una transformación lineal de un conjunto de variables aleatorias mediante una matriz "alta"? Cualquier referencia sería muy apreciada también.