Me refiero a cualquier razón aparte de la conveniencia de poder completar el análisis dentro de un solo procedimiento.
Me refiero a cualquier razón aparte de la conveniencia de poder completar el análisis dentro de un solo procedimiento.
Respuestas:
Si, por varias razones!
1) Paradoja de Simpson . A menos que el diseño sea equilibrado, si una de las variables afecta el resultado, no puede evaluar adecuadamente ni siquiera la dirección del efecto de la otra sin ajustar la primera (consulte el primer diagrama en el enlace, en particular, reproducido a continuación **). Esto ilustra el problema: el efecto dentro del grupo está aumentando (las dos líneas de color), pero si ignora la agrupación rojo-azul, obtendrá un efecto decreciente (la línea discontinua, gris): ¡el signo completamente incorrecto!
Si bien esto muestra una situación con una variable de agrupación continua y otra, pueden suceder cosas similares cuando los efectos principales de dos vías desequilibrados ANOVA se tratan como dos modelos de una vía.
2) Asumamos que hay un diseño completamente equilibrado. Entonces todavía desea hacerlo, porque si ignora la segunda variable mientras mira la primera (suponiendo que ambas tengan algún impacto), el efecto de la segunda entra en el término de ruido , inflándolo ... y sesgando todo su estándar errores al alza. En cuyo caso, los efectos significativos e importantes pueden parecer ruido.
Considere los siguientes datos, una respuesta continua y dos factores categóricos nominales:
y x1 x2
1 2.33 A 1
2 1.90 B 1
3 4.77 C 1
4 3.48 A 2
5 1.34 B 2
6 4.16 C 2
7 5.88 A 3
8 2.56 B 3
9 5.97 C 3
10 5.10 A 4
11 2.62 B 4
12 6.21 C 4
13 6.54 A 5
14 6.01 B 5
15 9.62 C 5
Los dos efectos principales anova son altamente significativos (porque es equilibrado, el orden no importa):
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.644 13.3220 24.284 0.0004000
x2 4 38.889 9.7222 17.722 0.0004859
Residuals 8 4.389 0.5486
Pero las anovas unidireccionales individuales no son significativas al nivel del 5%:
(1) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.687 13.3436 3.6967 0.05613
Residuals 12 43.315 3.6096
(2) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x2 4 38.889 9.7222 3.1329 0.06511
Residuals 10 31.033 3.1033
Observe en cada caso que el cuadrado medio para el factor no cambió ... pero los cuadrados medios residuales aumentaron dramáticamente (de 0.55 a más de 3 en cada caso). Ese es el efecto de omitir una variable importante.
** (el diagrama anterior fue realizado por el usuario de Wikipedia Schutz , pero se colocó en el dominio público; aunque no se requiere atribución para los elementos en el dominio público, creo que es digno de reconocimiento)
Si. Si las dos variables independientes están relacionadas y / o el ANOVA no está equilibrado, entonces un ANOVA bidireccional le muestra el efecto de cada variable que controla la otra.