Un ejemplo podría ayudar a ilustrar. Supongamos, en un marco de modelado causal, que está interesado en determinar si la relación entre (una exposición de interés) un (un resultado de interés) está mediada por una variable . Esto significa que en los dos modelos de regresión:Y WXYW
E[Y|X]E[Y|X,W]==β0+β1Xγ0+γ1X+γ2W
El efecto es diferente al efecto .β1γ1
Como ejemplo, considere la relación entre fumar y el riesgo cardiovascular (CV). Fumar obviamente aumenta el riesgo de CV (para eventos como ataque cardíaco y accidente cerebrovascular) al hacer que las venas se vuelvan frágiles y calcificadas. Sin embargo, fumar también es un supresor del apetito. Por lo tanto, sería curioso saber si la relación estimada entre fumar y el riesgo CV está mediada por el IMC, que independientemente es un factor de riesgo para el riesgo CV. Aquí podría ser un evento binario (infarto de miocardio o neurológico) en un modelo de regresión logística o una variable continua como la calcificación arterial coronaria (CAC), la fracción de eyección del ventrículo izquierdo (FEVI) o la masa ventricular izquierda (LVM).Y
Encajaríamos dos modelos 1: ajuste por fumar y el resultado junto con otros factores de confusión como la edad, el sexo, los ingresos y los antecedentes familiares de enfermedad cardíaca y luego 2: todas las covariables anteriores, así como el índice de masa corporal. La diferencia en el efecto de fumar entre los modelos 1 y 2 es donde basamos nuestra inferencia.
Estamos interesados en probar las hipótesis
HK::β1=γ1β1≠γ1
Una posible medida del efecto podría ser: o o cualquier cantidad de mediciones. Se pueden utilizar los estimadores usuales para y . El error estándar de estos estimadores es muy complicado de derivar. Sin embargo, el arranque de la distribución de ellos es una técnica comúnmente aplicada, y es fácil calcular el valor directamente a partir de eso.T=β1−γ1S=β1/γ1TSp