¿Por qué la prueba de Levene de igualdad de varianzas en lugar de la relación F?


21

SPSS utiliza la prueba de Levene para evaluar la homogeneidad de las variaciones en el procedimiento de prueba t de grupo independiente.

¿Por qué es mejor la prueba de Levene que una simple relación F de la relación de las varianzas de los dos grupos?


Respuestas:


34

Usted podría usar una prueba F para determinar la varianza de dos grupos, pero el uso de F a prueba las diferencias en la varianza requiere estrictamente que las distribuciones son normales. Usar la prueba de Levene (es decir, los valores absolutos de las desviaciones de la media) es más robusto, y usar la prueba de Brown-Forsythe (es decir, los valores absolutos de las desviaciones de la mediana ) es aún más robusto. SPSS está utilizando un buen enfoque aquí.

Actualización En respuesta al comentario a continuación, quiero aclarar lo que estoy tratando de decir aquí. La pregunta se refiere al uso de "una razón F simple de la razón de las varianzas de los dos grupos". A partir de esto, entendí que la alternativa es lo que a veces se conoce como la prueba de Hartley , que es un enfoque muy intuitivo para evaluar la heterogeneidad de la varianza. Aunque esto usa una proporción de variaciones, no es lo mismo que el utilizado en la prueba de Levene. Debido a que a veces es difícil entender lo que significa cuando solo se dice en palabras, daré ecuaciones para aclarar esto.

Prueba de Hartley:

F=s22s12
F=METROSsi/ /t-lmivmilsMETROSw/ /yo-lmivmils

En los tres casos, tenemos proporciones de variaciones, pero las variaciones específicas utilizadas difieren entre ellas. Lo que hace que la prueba de Levene y la prueba de Brown-Forsythe sean más robustas (y también distintas de cualquier otro ANOVA), es que se realizan sobre datos transformados , mientras que la relación F de las variaciones de grupo (prueba de Hartley) usa los datos sin procesar. Los datos transformados en cuestión son los valores absolutos de las desviaciones (de la media, en el caso de la prueba de Levene, y de la mediana, en el caso de la prueba de Brown-Forsythe).

Hay otras pruebas para la heterogeneidad de la varianza, pero estoy restringiendo mi discusión a estas, ya que entendí que eran el foco de la pregunta original. La razón para elegir entre ellos se basa en su rendimiento si los datos originales no son realmente normales; con la prueba F siendo lo suficientemente no robusta como para que no se recomiende; El test de Levene siendo ligeramente más potente que el BF si los datos realmente son normales, pero no absolutamente tan robusto si no lo son. La cita clave aquí es O'Brien (1981), aunque no pude encontrar una versión disponible en Internet. Pido disculpas si entendí mal la pregunta o si no estaba claro.


2
Debido a que el estadístico de Levene es una relación de cuadrados construidos a partir de esos residuos absolutos, y se refiere a una distribución F, ¡no es inmediatamente aparente que deba ser más robusto que otras pruebas basadas en relaciones de cuadrados! Puede estar pensando en variantes más robustas, como la prueba Brown-Forsythe . Vea una buena discusión de @chl en stats.stackexchange.com/questions/2591/… .
whuber

@whuber, gracias por el comentario y el enlace. Hay demasiado para responder en un comentario, así que edité mi respuesta. Creo que lo que estoy tratando de llegar debería ser más claro ahora. Sin embargo, si entendí mal, o simplemente estoy equivocado, puedo eliminar esta respuesta.
gung - Restablecer Monica

El (nuevo) último párrafo aclara su punto (+1).
whuber
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.