Estoy tratando de entender la lógica de separación de d en las redes bayesianas causales. Sé cómo funciona el algoritmo, pero no entiendo exactamente por qué el "flujo de información" funciona como se indica en el algoritmo.
Por ejemplo, en el gráfico anterior, pensemos que solo se nos da X y no se ha observado ninguna otra variable. Luego, de acuerdo con las reglas de separación d, la información fluye de X a D:
X influye en A, que es . Esto está bien, ya que A causa X y si conocemos el efecto X, esto afecta nuestra creencia sobre la causa A. La información fluye.
X influye en B, que es . Esto está bien, ya que A ha sido cambiado por nuestro conocimiento sobre X, el cambio en A también puede influir en nuestras creencias sobre su causa, B.
X influye en C, que es . Esto está bien porque sabemos que B está sesgado por nuestro conocimiento sobre su efecto indirecto, X, y dado que B está sesgado por X, esto influirá en todos los efectos directos e indirectos de B. C es un efecto directo de B y está influenciado por nuestro conocimiento sobre X.
Bueno, hasta este punto, todo está bien para mí, ya que el flujo de la información ocurre de acuerdo con las relaciones intuitivas de causa y efecto. Pero no obtengo el comportamiento especial de las llamadas "estructuras en V" o "colisionadores" en este esquema. De acuerdo con la teoría de la separación d, B y D son las causas comunes de C en el gráfico anterior y dice que si no observamos a C ni a ninguno de sus descendientes, la información de flujo de X se bloquea en C. Bueno, está bien. , pero mi pregunta es ¿por qué?
De los tres pasos anteriores, comenzados desde X, vimos que C está influenciado por nuestro conocimiento sobre X y el flujo de información se produjo de acuerdo con la relación causa-efecto. La teoría de la separación d dice que no podemos pasar de C a D ya que C no se observa. Pero creo que, dado que sabemos que C está sesgado y D es una causa de C, D también debería verse afectado, mientras que la teoría dice lo contrario. Claramente me falta algo en mi patrón de pensamiento, pero no puedo ver de qué se trata.
Entonces necesito una explicación de por qué el flujo de información se bloquea en C, si C no se observa.