Cox y Wermuth (1996) o Cox (1984) discutieron algunos métodos para detectar interacciones. El problema suele ser qué tan generales deberían ser los términos de interacción. Básicamente, (a) ajustamos (y probamos) todos los términos de interacción de segundo orden, uno a la vez, y (b) graficamos sus valores p correspondientes (es decir, los términos No. en función de ). Entonces, la idea es observar si se debe retener un cierto número de términos de interacción: bajo el supuesto de que todos los términos de interacción son nulos, la distribución de los valores p debe ser uniforme (o, de manera equivalente, los puntos en el diagrama de dispersión se deben distribuir aproximadamente a lo largo) una línea que pasa por el origen).1−p
Ahora, como dijo @Gavin , ajustar muchas (si no todas) las interacciones podría conducir a un sobreajuste, pero también es inútil en cierto sentido (algunos términos de interacción de alto orden a menudo no tienen ningún sentido). Sin embargo, esto tiene que ver con la interpretación, no con la detección de interacciones, y Cox ya proporcionó una buena revisión en Interpretación de la interacción: Una revisión ( The Annals of Applied Statistics 2007, 1 (2), 371–385). incluye referencias citadas anteriormente. Otras líneas de investigación que vale la pena observar son el estudio de los efectos epistáticos en los estudios genéticos, en particular los métodos basados en modelos gráficos (por ejemplo, un método eficiente para identificar interactuadores estadísticos en redes de asociación de genes ).
Referencias
- Cox, DR y Wermuth, N (1996). Dependencias multivariantes: modelos, análisis e interpretación . Chapman y Hall / CRC.
- Cox, DR (1984). Interacción . Revista estadística internacional , 52, 1–31.