Si eso es correcto. Básicamente, tienes
FX, Y( x , y) = fXEl | Y( x | y) fY( y) ,
y como dijiste, puedes tomar muestras de la densidad conjunta. Recoger solo las s de las muestras lo lleva a una muestra de la distribución marginal.X
Esto se debe a que el acto de ignorar la es similar a integrarse sobre ella. Vamos a entender esto con un ejemplo.y
Supongamos que = Altura de las madres e = Altura de la hija. El objetivo es obtener una muestra de para comprender la relación entre las alturas de las hijas y sus madres. (Estoy asumiendo que solo hay una hija en la familia, y restringiendo la población a todas las hijas mayores de 18 años para asegurar el crecimiento completo).Y ( X , Y )XY( X, Y)
Usted sale y obtiene una muestra representativa
( x1, y1) , … , ( Xnorte, ynorte) .
Por lo tanto, para cada madre, tienes la altura de su hija. Debe haber una clara relación entre y . Ahora suponga que de su conjunto de datos, ignora todos los datos de las hijas (suelte la ), entonces, ¿qué tiene? Tienes exactamente alturas de las madres elegidas al azar que será se basa en la marginal de .Y Y N XXYYnorteX