Un modelo probabilístico Causal Estructural (SCM) se define como una tupla donde U es un conjunto de variables exógenas, V un conjunto de variables endógenas, F es un conjunto de ecuaciones estructurales que determina los valores de cada variable endógena y P ( U ) una distribución de probabilidad sobre el dominio de la U .METRO= ⟨ U, V, F, P( U) ⟩UVFPAG( U)U
En un SCM que representan el efecto de una intervención en una variable por un submodelo M x = ⟨ U , V , F x , P ( U ) ⟩ donde F x indica que la ecuación estructural para X se sustituye por la nueva ecuación intervencionista . Por ejemplo, la intervención atómica de establecer la variable X en un valor específico x --- generalmente denotado por d o ( X = x ) --- consiste en reemplazar la ecuación por XXMETROX= ⟨ U, V, FX, P( U) ⟩FXXXXreo ( X= x )Xcon la ecuación .X= x
Para aclarar las ideas, imagine un modelo causal estructural no paramétrico definido por las siguientes ecuaciones estructurales:METRO
Z= UzX= f( Z, UX)Y= g( X, Z, Uy)
Donde las perturbaciones tienen alguna distribución de probabilidad P ( U ) . Esto induce una distribución de probabilidad sobre las variables endógenas P M ( Y , Z , X ) , y en particular una distribución condicional de Y dado X , P M ( Y | X ) .UPAG( U)PAGMETRO(Y,Z,X)YXPM(Y|X)
Pero aviso es la distribución "observacional" de Y dado X en el contexto de modelo M . ¿Cuál sería el efecto en la distribución de Y si interviniéramos en X estableciéndolo en x ? Esto no es más que la distribución de probabilidad de Y inducida por el modelo modificado M x :PM(Y|X)YXMYXxYMx
Z=UzX=xY=g(X,Z,Uy)
Es decir, la probabilidad intervencionista de si establecemos X = x viene dada por la probabilidad inducida en el submodelo M x , es decir, P M x ( Y | X = x ) y generalmente se denota por P ( Y | d o ( X = x ) ) . El operador d o ( X = x ) deja en claro que estamos calculando la probabilidad de YYX=xMxPMx(Y|X=x)P(Y|do(X=x))do(X=x)Y en un submodelo donde hay una configuración de intervención igual a xXxXX=x
P(Y|do(X))
hacer cálculo
do(⋅)P(Y|do(X)) y el do-cálculo está completo para modelos recursivos causales estructurales no paramétricos ).