(Saca Conover [1] de la estantería ...)
Esta idea es bastante antigua; se remonta al menos a van der Waerden (1952/1953) [2] [3], quien sugirió una prueba que corresponde al Kruskal Wallis pero con rangos reemplazados por puntajes normales. (La idea de usar valores normales aleatorios ordenados en lugar de una aproximación de sus expectativas o su mediana, es quizás incluso un poco más antigua).
Según Conover, Fisher y Yates (1957) [4] sugieren reemplazar las observaciones con puntuaciones normales esperadas (es decir, rangos transformados) en una variedad de pruebas donde se supondría la normalidad.
La eficiencia relativa asintótica en la normalidad será 1, lo que lo hace parecer bastante atractivo ... sin embargo, la ventaja sobre el Wilcoxon-Mann-Whitney (ganancia de potencia), incluso en la normalidad, es bastante pequeña, y Si la distribución es más pesada de lo normal (por ejemplo, logística), puede ser desventajoso hacer esto. (Algunas simulaciones sugieren que de hecho es así: a menos que la distribución ya sea cercana a lo normal, en cuyo caso no hay ningún beneficio en realizar la transformación, tal transformación puede perder potencia).
Chernoff y Lehmann [5] calculan el poder asintótico para una variedad de distribuciones; donde hay al menos una cola muy corta (como el uniforme), la prueba de puntaje normal puede tener mucho mejor ARE para una alternativa de cambio contra Wilcoxon-Mann-Whitney, mejor que la prueba t en sí. Sus resultados concuerdan con mis simulaciones para casos de colas más pesadas.
Tenga en cuenta que en el caso de dos muestras, a medida que la separación en los medios se hace grande, mientras que la muestra combinada parece bastante normal, las dos muestras no son normales en absoluto:
Como resultado, no todas las propiedades de la prueba normal se transferirán a la prueba de puntaje normal, y el comportamiento en separaciones más grandes (con muestras pequeñas) puede ser algo contradictorio.
Las pruebas obtenidas por esta idea a veces se denominan colectivamente pruebas de puntaje normal , cuyo término de búsqueda (a través de Google, por ejemplo) arroja varias referencias.
Por ejemplo, aquí , Richard Darlington habla de hacerlo para la prueba de rangos firmados de Wilcoxon; Señala que hay una ventaja sobre la prueba de rango simple, ya que reduce el número de valores vinculados de la estadística de prueba.
Antes de terminar escribiendo páginas sobre él, te dejaré buscar más.
Conover enumera una serie de otras referencias y tiene una buena discusión, por lo que definitivamente recomendaría leer eso.
El punto de Gelman, sin embargo, parece estar relacionado con la conveniencia , no con la necesidad de desarrollar una nueva prueba cada vez que la situación cambia; aunque si la conveniencia es el problema principal, ya existe la posibilidad de usar pruebas de permutación en cualquier estadística que nos guste. [Con el enfoque de puntaje normal, la dificultad es que aún necesitamos una forma adecuada de clasificar: no se pueden clasificar cosas que no son comparables bajo nulo y esperar el tipo correcto de comportamiento. Hay un problema similar con la prueba de permutación, ya que de igual manera necesita intercambiabilidad bajo nulo.]
Usted menciona una función R, pero puede clasificar y convertir a puntajes normales fácilmente en R simplemente usando funciones que ya vienen con R.
por ejemplo, usando los sleep
datos en R. harías una prueba t de esta manera:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, WJ (1980),
Estadísticas prácticas no paramétricas , 2e.
Wiley pp. 316–327.
(Desde el enlace de Wikipedia anterior parece que en 3e (1999) la discusión comienza en p396)
[2] van der Waerden, BL (1952),
"Ordenar pruebas para el problema de dos muestras y su poder",
Actas de la Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 55 ( Indagationes Mathematicae 14 ), 453–458.
[3] van der Waerden, BL (1953),
"Ordenar pruebas para el problema de dos muestras. II, III",
Actas de la Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303–310 y 311–316.
(también hay correcciones al documento de 1952 en la p 80 de ese volumen)
[4] Fisher RA y Yates F. (1957)
Tablas estadísticas para investigación biológica, agrícola y médica , 5e, Oliver & Boyd, Edimburgo.
[5] Hodges, JL; Lehmann, EL (1961),
"Comparación de los puntajes normales y las pruebas de Wilcoxon",
Actas del Cuarto Simposio de Berkeley sobre Estadística matemática y probabilidad, Volumen 1: Contribuciones a la teoría de la estadística , 307-317,
University of California Press, Berkeley, California.
Http://projecteuclid.org/euclid.bsmsp/1200512171 .