Puede probarlo calculando explícitamente la densidad condicional por la fuerza bruta, como en el enlace Procrastinator (+1) en los comentarios. Pero también hay un teorema que dice que todas las distribuciones condicionales de una distribución normal multivariada son normales. Por lo tanto, todo lo que queda es calcular el vector medio y la matriz de covarianza. Recuerdo que derivamos esto en una clase de series de tiempo en la universidad al definir inteligentemente una tercera variable y usar sus propiedades para derivar el resultado de manera más simple que la solución de fuerza bruta en el enlace (siempre y cuando se sienta cómodo con el álgebra matricial). Voy de memoria pero fue algo como esto:
Deje que sea la primera partición y la segunda. Ahora defina donde . Ahora podemos escribirx1x2z=x1+Ax2A=−Σ12Σ−122
cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12−Σ12Σ−122Σ22=0
Por lo tanto, y no están correlacionados y, dado que son conjuntamente normales, son independientes . Ahora, claramente , por lo tanto, se deduce quezx2E(z)=μ1+Aμ2
E(x1|x2)=E(z−Ax2|x2)=E(z|x2)−E(Ax2|x2)=E(z)−Ax2=μ1+A(μ2−x2)=μ1+Σ12Σ−122(x2−μ2)
lo que prueba la primera parte. Para la matriz de covarianza, tenga en cuenta que
var(x1|x2)=var(z−Ax2|x2)=var(z|x2)+var(Ax2|x2)−Acov(z,−x2)−cov(z,−x2)A′=var(z|x2)=var(z)
Ahora casi hemos terminado:
var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A′+Acov(x1,x2)+cov(x2,x1)A′=Σ11+Σ12Σ−122Σ22Σ−122Σ21−2Σ12Σ−122Σ21=Σ11+Σ12Σ−122Σ21−2Σ12Σ−122Σ21=Σ11−Σ12Σ−122Σ21
lo que prueba la segunda parte.
Nota: Para aquellos que no están muy familiarizados con el álgebra matricial utilizado aquí, este es un excelente recurso .
Editar: Una propiedad utilizada aquí, esta no está en el libro de cocina de la matriz (buena captura @FlyingPig) es la propiedad 6 en la página de wikipedia sobre matrices de covarianza: que es para dos vectores aleatorios , Para escalares, por supuesto, pero para los vectores son diferentes en la medida en que las matrices están dispuestas de manera diferente.x,y
var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)