Recomiendo echar un vistazo a la Econometría en su mayoría inofensiva: tienen una buena explicación de esto a un nivel intuitivo.
El problema que está tratando de resolver es el sesgo de selección. Si una variable se correlaciona con los resultados potenciales y con la probabilidad de recibir tratamiento, entonces si encuentra que el resultado esperado del tratamiento es mejor que el resultado esperado del no tratado, esto puede ser un hallazgo espurio ya que los tratados tienden a tener una mayor y, por lo tanto, tienen mayor . El problema surge porque hace que correlacionen con el tratamiento.xiy0i,y1ixy0i,y1ixy0i,y1i
Este problema se puede resolver controlando . Si creemos que la relación entre los resultados potenciales y las variables es lineal, solo hacemos esto al incluir en una regresión con una variable ficticia para el tratamiento, y la variable ficticia interactúa con . Por supuesto, la regresión lineal es flexible ya que también podemos incluir funciones de . ¿Pero qué pasa si no queremos imponer una forma funcional? Entonces necesitamos usar un enfoque no paramétrico: coincidencia.xxxxx
Con el emparejamiento, comparamos observaciones tratadas y no tratadas con similares . Salimos de esto con una estimación del efecto del tratamiento para todos los valores de (o pequeños rangos de valores o "cubos") para los que tenemos observaciones tratadas y no tratadas. Si no tenemos muchos valores o cubetas de , en particular si es un vector de alta dimensión, por lo que es difícil encontrar observaciones cercanas entre sí, entonces es útil proyectar este espacio en una dimensión.xxxx
Esto es lo que hace el emparejamiento de puntaje de propensión. Si no están correlacionados con el tratamiento dado , entonces resulta que tampoco están correlacionados con el tratamiento dado donde es la probabilidad de tratamiento dado , es decir, el puntaje de propensión de .y0i,y1ixip(xi)p(x)xx
Aquí está su intuición: si encontramos una submuestra de observaciones con un puntaje de propensión muy similar , entonces para esa submuestra, los grupos tratados y no tratados no están correlacionados con . Es igualmente probable que cada observación sea tratada o no tratada; Esto implica que cualquier observación tratada es igualmente probable que provenga de cualquiera de los valores de en la submuestra. Dado que es lo que determina los resultados potenciales en nuestro modelo, esto implica que, para esa submuestra, los resultados potencialesp(x)xxxy0i,y1ino están correlacionados con el tratamiento. Esta condición asegura que la diferencia promedio de resultado de la submuestra entre los tratados y no tratados es una estimación consistente del efecto promedio del tratamiento en esta submuestra, es decir
E[yi|Treated,p(x)]−E[yi|Untreated,p(x)]
es una estimación consistente del efecto del tratamiento promedio local.
Otras lecturas:
¿Realmente deberíamos usar el emparejamiento de puntaje de propensión en la práctica?
Pregunta relacionada que compara emparejamiento y regresión