Solo para amplificar: creo que soy el solicitante más reciente.
En comentarios específicos sobre los puntos de Mike:
Es claramente cierto que la diferencia I / II / III solo se aplica con predictores correlacionados (de los cuales los diseños desequilibrados son el ejemplo más común, ciertamente en ANOVA factorial), pero esto me parece un argumento que descarta el análisis de la situación desequilibrada (y, por lo tanto, cualquier debate de Tipo I / II / III). Puede ser imperfecto, pero así es como suceden las cosas (y en muchos contextos los costos de una mayor recopilación de datos superan el problema estadístico, a pesar de las advertencias).
Esto es completamente justo y representa la carne de la mayoría de los argumentos de "II versus III, favoreciendo II" que he encontrado. El mejor resumen que he encontrado es Langsrud (2003) "ANOVA para datos desequilibrados: use sumas de cuadrados de Tipo II en lugar de Tipo III", Estadísticas y Computación 13: 163-167 (Tengo un PDF si el original es difícil de encontrar ) Él argumenta (tomando el caso de dos factores como el ejemplo básico) que si hay una interacción, hay una interacción, por lo que la consideración de los efectos principales generalmente no tiene sentido (un punto obviamente claro), y si no hay interacción, el análisis de Tipo II de Los efectos principales son más potentes que el Tipo III (sin duda), por lo que siempre debe ir con el Tipo II. He visto otros argumentos (por ejemplo, Venables,
Y estoy de acuerdo con esto: si tiene una interacción pero también tiene alguna pregunta sobre el efecto principal, entonces es probable que esté en territorio de bricolaje.
Está claro que hay quienes solo quieren el Tipo III porque SPSS lo hace, o alguna otra referencia a la Autoridad Superior estadística. No estoy totalmente en contra de este punto de vista, si se trata de una elección de muchas personas que se apegan a SPSS (que tengo algunas cosas en contra, a saber, el tiempo, el dinero y las condiciones de caducidad de la licencia) y las SS Tipo III, o muchas personas cambiando a R y Tipo III SS. Sin embargo, este argumento es claramente cojo estadísticamente.
Sin embargo, el argumento que encontré más sustancial a favor del Tipo III es el que Myers & Well (2003, "Diseño de investigación y análisis estadístico", págs. 323, 626-629) y Maxwell & Delaney (2004, hicieron independientemente). Diseño de experimentos y análisis de datos: una perspectiva de comparación de modelo ", págs. 324-328, 332-335). Eso es lo siguiente:
- si hay una interacción, todos los métodos dan el mismo resultado para la suma de cuadrados de interacción
- Tipo II asume que no hay interacción para su prueba de efectos principales; tipo III no
- Algunos (por ejemplo, Langsrud) argumentan que si la interacción no es significativa, entonces está justificado suponer que no hay una y observar los efectos principales (más potentes) de Tipo II
- Pero si la prueba de la interacción tiene poca potencia, pero hay una interacción, la interacción puede resultar "no significativa" y aún así conducir a una violación de los supuestos de la prueba de efectos principales de Tipo II, lo que sesga esas pruebas para que sean demasiado liberales. .
- Myers & Well citan a Appelbaum / Cramer como los principales defensores del enfoque de Tipo II, y continúan [p323]: "... Se podrían utilizar criterios más conservadores para la no importancia de la interacción, como exigir que la interacción no sea significativa en el nivel .25, pero no hay una comprensión suficiente de las consecuencias de incluso este enfoque. Como regla general, las sumas de cuadrados Tipo II no deben calcularse a menos que haya una razón a priori fuerte para asumir que no hay efectos de interacción, y una interacción claramente no significativa suma de cuadrados." Citan [p629] En general, Lee y Hornick 1981 como una demostración de que las interacciones que no se acercan a la importancia pueden sesgar las pruebas de los efectos principales. Maxwell y Delaney [p334] abogan por el enfoque de Tipo II si la interacción de la población es cero, por poder, y el enfoque Tipo III si no lo es [para la interpretabilidad de los medios derivados de este enfoque]. También abogan por usar el Tipo III en la situación de la vida real (cuando está haciendo inferencias sobre la presencia de la interacción de los datos) debido al problema de cometer un error de tipo 2 [con poca potencia] en la prueba de interacción y, por lo tanto, violar accidentalmente los supuestos del enfoque de SS Tipo II; Luego hacen otros puntos similares a Myers & Well, ¡y observan el largo debate sobre este tema! haciendo inferencias acerca de la presencia de la interacción de los datos) debido al problema de cometer un error de tipo 2 [con poca potencia] en la prueba de interacción y, por lo tanto, violar accidentalmente los supuestos del enfoque de SS Tipo II; Luego hacen otros puntos similares a Myers & Well, ¡y observan el largo debate sobre este tema! haciendo inferencias acerca de la presencia de la interacción de los datos) debido al problema de cometer un error de tipo 2 [con poca potencia] en la prueba de interacción y, por lo tanto, violar accidentalmente los supuestos del enfoque de SS Tipo II; Luego hacen otros puntos similares a Myers & Well, ¡y observan el largo debate sobre este tema!
Entonces, mi interpretación (¡y no soy un experto!) Es que hay mucha autoridad estadística superior en ambos lados del argumento; que los argumentos habituales presentados no se refieren a la situación habitual que daría lugar a problemas (esa situación es la común de interpretar los efectos principales con una interacción no significativa); y que hay razones justas para preocuparse por el enfoque de Tipo II en esa situación (y todo se reduce a una cuestión de sobre-liberalismo de poder versus potencial).
Para mí, eso es suficiente para desear la opción Tipo III en ezANOVA, así como el Tipo II, porque (por mi dinero) es una interfaz excelente para los sistemas ANOVA de R. R es, desde mi punto de vista, fácil de usar para los novatos, y el paquete "ez", con ezANOVA y las funciones de trazado de efectos bastante encantadoras, hace que R sea accesible para un público de investigación más general. Algunos de mis pensamientos en progreso (y un truco desagradable para ezANOVA) están en http://www.psychol.cam.ac.uk/statistics/R/anova.html .
¡Estaría interesado en escuchar los pensamientos de todos!