El documento de ayuda "muesca" ( o texto original ) de boxplot en 'R' ofrece lo siguiente:
Si las muescas de dos parcelas no se superponen, esta es una "evidencia fuerte" de que las dos medianas difieren (Chambers et al, 1983, p. 62). Ver boxplot.stats para los cálculos utilizados.
y ' boxplot.stats ' ofrece lo siguiente:
Las muescas (si se solicitan) se extienden a +/- 1.58 IQR / sqrt (n). Esto parece estar basado en los mismos cálculos que la fórmula con 1.57 en Chambers et al (1983, p. 62), dada en McGill et al (1978, p. 16). Se basan en la normalidad asintótica de la mediana y tamaños de muestra aproximadamente iguales para las dos medianas que se comparan, y se dice que son bastante insensibles a las distribuciones subyacentes de las muestras. La idea parece ser dar aproximadamente un intervalo de confianza del 95% para la diferencia en dos medianas.
Ahora estoy más familiarizado con el uso de la versión JMP de la prueba Tukey-Kramer para comparar las medias de las columnas. La documentación para JMP da esto:
Muestra una prueba que está dimensionada para todas las diferencias entre las medias. Esta es la prueba Tukey o Tukey-Kramer HSD (diferencia honestamente significativa). (Tukey 1953, Kramer 1956). Esta prueba es una prueba exacta de nivel alfa si los tamaños de muestra son los mismos y conservadora si los tamaños de muestra son diferentes (Hayter 1984).
Pregunta: ¿Cuál es la naturaleza de la conexión entre los dos enfoques? ¿Hay alguna manera de transformar uno en el otro?
Parece que uno está buscando un IC del 95% aproximado para la mediana y determina si hay superposición; y la otra es una "prueba alfa exacta" (mis muestras son del mismo tamaño) para determinar si las medianas de dos conjuntos de muestras están dentro de un rango razonable entre sí.
Me refiero a los paquetes, pero estoy interesado en las matemáticas detrás de la lógica.