Si no estoy interesado en la interacción, ¿hay alguna razón para ejecutar un ANOVA de dos vías en lugar de dos ANOVA de una vía?

9

Me refiero a cualquier razón aparte de la conveniencia de poder completar el análisis dentro de un solo procedimiento.

anova

— user1205901 - Restablecer Monica
fuente

1

Aquí está la cosa: si hay una interacción, no tiene sentido "no estar interesado en ella", porque no puede interpretar significativamente los efectos principales solo si hay una interacción. Entonces, además de la respuesta a continuación, le insto a que reconsidere lo que está haciendo.

— Erik

19

Si, por varias razones!

1) Paradoja de Simpson . A menos que el diseño sea equilibrado, si una de las variables afecta el resultado, no puede evaluar adecuadamente ni siquiera la dirección del efecto de la otra sin ajustar la primera (consulte el primer diagrama en el enlace, en particular, reproducido a continuación **). Esto ilustra el problema: el efecto dentro del grupo está aumentando (las dos líneas de color), pero si ignora la agrupación rojo-azul, obtendrá un efecto decreciente (la línea discontinua, gris): ¡el signo completamente incorrecto!

ingrese la descripción de la imagen aquí

Si bien esto muestra una situación con una variable de agrupación continua y otra, pueden suceder cosas similares cuando los efectos principales de dos vías desequilibrados ANOVA se tratan como dos modelos de una vía.

2) Asumamos que hay un diseño completamente equilibrado. Entonces todavía desea hacerlo, porque si ignora la segunda variable mientras mira la primera (suponiendo que ambas tengan algún impacto), el efecto de la segunda entra en el término de ruido , inflándolo ... y sesgando todo su estándar errores al alza. En cuyo caso, los efectos significativos e importantes pueden parecer ruido.

Considere los siguientes datos, una respuesta continua y dos factores categóricos nominales:

      y x1 x2
1  2.33  A  1
2  1.90  B  1
3  4.77  C  1
4  3.48  A  2
5  1.34  B  2
6  4.16  C  2
7  5.88  A  3
8  2.56  B  3
9  5.97  C  3
10 5.10  A  4
11 2.62  B  4
12 6.21  C  4
13 6.54  A  5
14 6.01  B  5
15 9.62  C  5

Los dos efectos principales anova son altamente significativos (porque es equilibrado, el orden no importa):

Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value    Pr(>F)    
x1         2 26.644 13.3220  24.284 0.0004000 
x2         4 38.889  9.7222  17.722 0.0004859 
Residuals  8  4.389  0.5486

Pero las anovas unidireccionales individuales no son significativas al nivel del 5%:

(1) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x1         2 26.687 13.3436  3.6967 0.05613 
Residuals 12 43.315  3.6096                  

(2) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x2         4 38.889  9.7222  3.1329 0.06511 
Residuals 10 31.033  3.1033

Observe en cada caso que el cuadrado medio para el factor no cambió ... pero los cuadrados medios residuales aumentaron dramáticamente (de 0.55 a más de 3 en cada caso). Ese es el efecto de omitir una variable importante.

** ^{(el diagrama anterior fue realizado por el usuario de Wikipedia Schutz , pero se colocó en el dominio público; aunque no se requiere atribución para los elementos en el dominio público, creo que es digno de reconocimiento)}

— Glen_b -Reinstate a Monica
fuente

6

Si. Si las dos variables independientes están relacionadas y / o el ANOVA no está equilibrado, entonces un ANOVA bidireccional le muestra el efecto de cada variable que controla la otra.

— Peter Flom - Restablece a Monica
fuente