"El concepto de una probabilidad condicional con respecto a una hipótesis aislada cuya probabilidad es igual a 0 es inadmisible". A. Kolmogorov
Para variables aleatorias continuas, e Y dicen, las distribuciones condicionales se definen por la propiedad de que recuperan la medida de probabilidad original, es decir, para todos los conjuntos medibles A ∈ B ( X ) , B ∈ B ( Y ) , P ( X ∈ A , Y ∈ B ) = ∫ B d P Y ( y ) ∫ B d )XYA∈B(X)B∈B(Y) |
P(X∈A,Y∈B)=∫BdPY(y)∫BdPX|Y(x|y)
Esto implica que la densidad condicional se define arbitrariamente en conjuntos de medida cero o, en otras palabras, que la densidad condicional
se define en
casi todas partes . Como el conjunto
{ 5 , 6 } es de medida cero frente a la medida de Lebesgue, esto significa que puede definir tanto
p ( 5 ) como
p ( 6 )pagXEl | Y( x | y){ 5 , 6 }p ( 5 )p ( 6 ) de manera absolutamente arbitraria y, por lo tanto, que la probabilidad
puede tomar cualquier valor.
P (U= 5 | U∈ { 5 , 6 } )
Esto no significa que no pueda definir una densidad condicional mediante la fórmula de la relación como en el caso normal bivariado, sino simplemente que la densidad solo se define en casi todas partes para ambos x e y .
F( yEl | x)=f( x , y) / f( x )
Xy
"Muchos argumentos bastante inútiles han surgido, entre probabilistas competentes, sobre cuál de estos resultados es 'correcto'". ET Jaynes
El hecho de que el argumento limitante (cuando va a cero) en la respuesta anterior parece dar una respuesta natural e intuitiva está relacionado con la paradoja de Borel . La elección de la parametrización en el límite es importante, como se muestra en el siguiente ejemplo que uso en mis clases de pregrado.ϵ
Tome la bivariada normal ¿Cuál es la densidad condicional de X dado queX, Y∼iidnorte( 0 , 1 )
X ?X= Y
Si se parte de la densidad conjunta , la respuesta "intuitiva" es [proporcional a] φ ( x ) 2 . Esto se puede obtener considerando el cambio de la variable ( x , t ) = ( x , y - x ) ∼ φ ( x ) φ ( t + x ) donde T = Y - X tiene la densidad φ (φ ( x ) φ ( y)φ ( x )2
( x , t ) = ( x , y- x ) ∼ φ ( x ) φ ( t + x )
T= Y- X . Por lo tanto,
f(x|t)= φ ( x ) φ ( tφ ( t / 2-√) / 2-√ y
f(x|t=0)=φ(x)φF( x | t ) = φ ( x ) φ ( t + x )φ ( t / 2-√) / 2-√
Sin embargo, si se considera el cambio de variable
(x,r)=(x,y/x)∼φ(x)φ(rx)| x| la densidad marginal de
R=Y/Xes la densidad de Cauchy
ψ(r)=1/π{1+r2F( x | t = 0 ) = φ ( x ) φ ( x )φ ( 0 / 2-√) / 2-√= φ ( x )22-√
( x , r ) = ( x , y/ x)∼φ(x)φ(rx) | x |
R = Y/ X y la densidad condicional de
Xψ ( r ) = 1 / π{ 1 + r2}Xdado
es
f (x | / 2R Por lo tanto,
f ( x | r = 1 ) = π φ ( x ) 2 |F( x | r ) = φ ( x ) φ ( r x ) | x | × π{ 1 + r2}
Y aquí radica la "paradoja": los eventos
R = 1 y
T = 0 son los mismos que
X = Y , pero conducen a diferentes densidades condicionales en
F( x | r = 1 ) = πφ ( x )2El | x | / 2.
R = 1T= 0X= Y .
X