Respuestas:
No creo que haya un consenso sobre la terminología aquí, pero lo siguiente es lo que creo que la mayoría de la gente tiene en mente cuando alguien dice "efecto parcial promedio" o "efecto marginal promedio".
Supongamos, para concretar, que estamos analizando una población de personas. Considere el modelo lineal
donde se observan variables aleatorias escalares observadas, y es una variable aleatoria escalar no observada. Supongamos que es una constante desconocida. Supongamos que este es un modelo estructural, lo que significa que tiene una interpretación causal. Entonces, si pudiéramos elegir a una persona de la población y aumentar su valor de en 1 unidad, entonces su valor de aumentaría en . Entonces se llama el efecto marginal o causal de sobre
Ahora, suponiendo que es una constante significa que no importa qué persona elegimos de la población, un aumento de una unidad en tiene el mismo efecto en --- aumenta en . Esto es claramente restrictivo. Podemos relajar esta suposición de efecto constante suponiendo que sea una variable aleatoria --- cada persona tiene un valor diferente de . En consecuencia, hay una distribución completa de efectos marginales, la distribución de . La media de esta distribución, , se llama efecto marginal promedioX(AME), o efecto parcial promedio. Si tuviéramos que aumentar el valor de para todos en una unidad, el AME da el cambio promedio en
Alternativamente, considere el modelo no lineal
donde nuevamente son observables escalares y es un escalar no observable, es alguna función desconocida (suponga que es diferenciable por simplicidad). Aquí el efecto causal / marginal de sobre es . Este valor puede depender del valor de . Por lo tanto, incluso si miramos a las personas que tienen el mismo valor observado de , un pequeño aumento en no necesariamente aumentará en la misma cantidad, porque cada persona puede tener un valor diferente de
También tenga en cuenta que estos objetos también podrían denominarse efectos de tratamiento promedio, especialmente cuando se considera una diferencia finita. Por ejemplo, la diferencia de la función estructural en ('tratado') y en ('no tratado'), promediada sobre los no observables.
Finalmente, para ser claros, tenga en cuenta que cuando me refiero a las 'distribuciones' anteriores, me refiero a las distribuciones sobre la población de personas . Cada persona en la población tiene un valor de , de , y de . Por lo tanto, hay una distribución de estos valores si miro a todas las personas de la población. El experimento mental aquí es el siguiente. Toma a todas las personas con . Ahora tome una de estas personas y aumente su valor en una pequeña cantidad, pero mantenga su valor igual, y anotamos el cambio en su valorHacemos esto para cada persona con , y luego promediamos los valores. Esto es lo que significa promediar .
Los efectos parciales promedio (APE) son la contribución de cada variable en la escala de resultados, condicionada a las otras variables involucradas en la transformación de la función de enlace del predictor lineal
Los efectos marginales promedio (AME) son la contribución marginal de cada variable en la escala del predictor lineal .
Esta documentación del margins
paquete para R es bastante útil para comprender.
"average partial effects"
(o, mejor aún"average partial effects" definition
) presenta excelentes referencias. Sin embargo, una respuesta clara de un experto sería muy bienvenida aquí.