Por ejemplo, las personas a menudo eligen usar una prueba no paramétrica cuando alguna otra prueba sugiere que los residuos no se distribuyen normalmente. Este enfoque parece bastante aceptado pero no parece estar de acuerdo con la primera oración de este párrafo. Solo esperaba obtener aclaraciones sobre este tema.
Sí, muchas personas hacen este tipo de cosas y cambian su segunda prueba por una que pueda tratar la heterocedasticidad cuando rechazan la igualdad de varianza, y así sucesivamente.
El hecho de que algo sea común no significa que sea necesariamente sabio.
De hecho, en algunos lugares (no nombraré las disciplinas más ofensivas), muchas de estas pruebas formales de hipótesis contingentes a otras pruebas formales de hipótesis se enseñan realmente.
El problema al hacerlo es que sus procedimientos no tienen sus propiedades nominales, a veces ni siquiera cercanas. (Por otro lado, asumir cosas como esas sin ninguna consideración en absoluto por una violación potencialmente extrema podría ser aún peor).
Varios documentos sugieren que para el caso de heterocedasticidad, es mejor actuar simplemente como si las variaciones no fueran iguales que probarlo y solo hacer algo al respecto en el rechazo.
En el caso de la normalidad, está menos claro. Al menos en muestras grandes, en muchos casos la normalidad no es tan crucial (pero irónicamente, con muestras grandes, es mucho más probable que rechace su prueba de normalidad), siempre que la no normalidad no sea demasiado salvaje. Una excepción es para los intervalos de predicción, donde realmente necesita su suposición de distribución para estar cerca de la derecha.
En parte, un problema es que las pruebas de hipótesis responden una pregunta diferente a la que necesita ser respondida. Realmente no necesita saber "los datos son realmente normales" (casi siempre, no serán exactamente normales a priori ). La pregunta es más bien "cuán grave será el impacto de la no normalidad en mi inferencia".
El segundo problema generalmente es casi independiente del tamaño de la muestra o en realidad mejora con el aumento del tamaño de la muestra; sin embargo, las pruebas de hipótesis casi siempre rechazarán en muestras de gran tamaño.
Hay muchas situaciones en las que hay procedimientos robustos o incluso libres de distribución que están muy cerca de ser completamente eficientes, incluso en la normalidad (y potencialmente mucho más eficientes en algunas desviaciones bastante modestas), en muchos casos parecería una tontería no tomar el mismo enfoque prudente.