Los dos modelos que enumeró en su respuesta se pueden volver a expresar para dejar en claro cómo se postula el efecto de para depender de (o al revés) en cada modelo.X1X2
El primer modelo se puede volver a expresar así:
Y=β0+(β1+β3X2)X1+β2X2+ϵ,
lo que muestra que, en este modelo, se supone que tiene un efecto lineal sobre (controlando el efecto de ) pero la magnitud de este efecto lineal, capturado por el coeficiente de pendiente de , cambia linealmente en función de . Por ejemplo, el efecto de en puede aumentar en magnitud a medida que aumentan los valores de .X1YX2X1X2X1YX2
El segundo modelo puede reexpresarse así:
Y=β0+(β1+β3X2)X1+β4X21+β2X2+β5X22+ϵ,
lo que muestra que, en este modelo, se supone que el efecto de en (que controla el efecto de ) es cuadrático en lugar de lineal. Este efecto cuadrático se captura al incluir y en el modelo. Si bien se supone que el coeficiente de es independiente de , se supone que el coeficiente de depende linealmente de .X1YX2X1X21X21X2X1X2
El uso de cualquiera de los modelos implicaría que está haciendo suposiciones completamente diferentes sobre la naturaleza del efecto de en (controlando el efecto de ).X1YX2
Por lo general, las personas se ajustan al primer modelo. Luego podrían trazar los residuos de ese modelo contra y por turnos. Si los residuos revelan un patrón cuadrático en los residuos en función de y / o , el modelo se puede aumentar en consecuencia para que incluya y / o (y posiblemente su interacción).X1X2X1X2X21X22
Tenga en cuenta que simplifiqué la notación que usó para la coherencia y también expliqué el término de error explícito en ambos modelos.