Usted podría usar una prueba F para determinar la varianza de dos grupos, pero el uso de F a prueba las diferencias en la varianza requiere estrictamente que las distribuciones son normales. Usar la prueba de Levene (es decir, los valores absolutos de las desviaciones de la media) es más robusto, y usar la prueba de Brown-Forsythe (es decir, los valores absolutos de las desviaciones de la mediana ) es aún más robusto. SPSS está utilizando un buen enfoque aquí.
Actualización En respuesta al comentario a continuación, quiero aclarar lo que estoy tratando de decir aquí. La pregunta se refiere al uso de "una razón F simple de la razón de las varianzas de los dos grupos". A partir de esto, entendí que la alternativa es lo que a veces se conoce como la prueba de Hartley , que es un enfoque muy intuitivo para evaluar la heterogeneidad de la varianza. Aunque esto usa una proporción de variaciones, no es lo mismo que el utilizado en la prueba de Levene. Debido a que a veces es difícil entender lo que significa cuando solo se dice en palabras, daré ecuaciones para aclarar esto.
Prueba de Hartley:
F= s22s21
F= MSb / t - l e v e l sMETROSw / i - l e v e l s
En los tres casos, tenemos proporciones de variaciones, pero las variaciones específicas utilizadas difieren entre ellas. Lo que hace que la prueba de Levene y la prueba de Brown-Forsythe sean más robustas (y también distintas de cualquier otro ANOVA), es que se realizan sobre datos transformados , mientras que la relación F de las variaciones de grupo (prueba de Hartley) usa los datos sin procesar. Los datos transformados en cuestión son los valores absolutos de las desviaciones (de la media, en el caso de la prueba de Levene, y de la mediana, en el caso de la prueba de Brown-Forsythe).
Hay otras pruebas para la heterogeneidad de la varianza, pero estoy restringiendo mi discusión a estas, ya que entendí que eran el foco de la pregunta original. La razón para elegir entre ellos se basa en su rendimiento si los datos originales no son realmente normales; con la prueba F siendo lo suficientemente no robusta como para que no se recomiende; El test de Levene siendo ligeramente más potente que el BF si los datos realmente son normales, pero no absolutamente tan robusto si no lo son. La cita clave aquí es O'Brien (1981), aunque no pude encontrar una versión disponible en Internet. Pido disculpas si entendí mal la pregunta o si no estaba claro.