Muescas de diagrama de caja vs. intervalo Tukey-Kramer


10

El documento de ayuda "muesca" ( o texto original ) de boxplot en 'R' ofrece lo siguiente:

Si las muescas de dos parcelas no se superponen, esta es una "evidencia fuerte" de que las dos medianas difieren (Chambers et al, 1983, p. 62). Ver boxplot.stats para los cálculos utilizados.

y ' boxplot.stats ' ofrece lo siguiente:

Las muescas (si se solicitan) se extienden a +/- 1.58 IQR / sqrt (n). Esto parece estar basado en los mismos cálculos que la fórmula con 1.57 en Chambers et al (1983, p. 62), dada en McGill et al (1978, p. 16). Se basan en la normalidad asintótica de la mediana y tamaños de muestra aproximadamente iguales para las dos medianas que se comparan, y se dice que son bastante insensibles a las distribuciones subyacentes de las muestras. La idea parece ser dar aproximadamente un intervalo de confianza del 95% para la diferencia en dos medianas.

Ahora estoy más familiarizado con el uso de la versión JMP de la prueba Tukey-Kramer para comparar las medias de las columnas. La documentación para JMP da esto:

Muestra una prueba que está dimensionada para todas las diferencias entre las medias. Esta es la prueba Tukey o Tukey-Kramer HSD (diferencia honestamente significativa). (Tukey 1953, Kramer 1956). Esta prueba es una prueba exacta de nivel alfa si los tamaños de muestra son los mismos y conservadora si los tamaños de muestra son diferentes (Hayter 1984).

Pregunta: ¿Cuál es la naturaleza de la conexión entre los dos enfoques? ¿Hay alguna manera de transformar uno en el otro?

Parece que uno está buscando un IC del 95% aproximado para la mediana y determina si hay superposición; y la otra es una "prueba alfa exacta" (mis muestras son del mismo tamaño) para determinar si las medianas de dos conjuntos de muestras están dentro de un rango razonable entre sí.

Me refiero a los paquetes, pero estoy interesado en las matemáticas detrás de la lógica.

Respuestas:


11

En lo que respecta al diagrama de caja con muescas, la referencia de McGill et al [1] mencionada en su pregunta contiene detalles bastante completos (no todo lo que digo aquí se menciona explícitamente allí, pero sin embargo es lo suficientemente detallado como para descubrirlo).

El intervalo es robusto pero basado en Gauss

El artículo cita el siguiente intervalo para muescas (donde es la mediana de la muestra y R es el rango intercuartil de la muestra):MR

M±1.7×1.25R/(1.35N)

dónde:

  • 1.35σσR/1.35σ

  • 1.2514nf02f0f012πσ0.3989σ12Nf0=π/2σ/N1.253σ/N

    N

    1.25R/(1.35N)

  • Entonces, todo lo que queda por discutir es el factor de 1.7.

    Tenga en cuenta que si estuviéramos comparando una muestra con un valor fijo (digamos una mediana hipotética) usaríamos 1.96 para una prueba de 5%; en consecuencia, si tuviéramos dos errores estándar muy diferentes (uno relativamente grande, uno muy pequeño), ese sería el factor a usar (ya que si el valor nulo fuera verdadero, la diferencia se debería casi por completo a la variación en el que tiene mayor error estándar, y el pequeño podría, aproximadamente, ser tratado como efectivamente solucionado).

    1.96/21.386

    rr:11.96/1+1/r

Ponerlos todos juntos (1.35,1.25 y 1.7) da alrededor de 1.57. Algunas fuentes obtienen 1.58 calculando el 1.35 o el 1.25 (o ambos) con mayor precisión pero como un compromiso entre 1.386 y 1.96, ese 1.7 ni siquiera es exacto para dos cifras significativas (es solo un valor de compromiso de estadio), por lo que la precisión adicional es no tiene sentido (también podrían haber redondeado todo a 1.6 y terminar con eso).

Tenga en cuenta que aquí no hay ajustes para comparaciones múltiples en ningún lugar.


Hay algunas analogías distintas en los límites de confianza para una diferencia en el HSD Tukey-Kramer :

y¯iy¯j±qα;k;Nk2σ^ε1ni+1nj

Pero ten en cuenta que

  • c.1ni+1njk.1nik.1nj1.961.96/2

  • se basa en medios, no en medianas (por lo tanto, no 1.35)

  • q2

Entonces, si bien varias de las ideas detrás de la forma de los componentes son algo análogas, en realidad son bastante diferentes en lo que están haciendo.

[1] McGill, R., Tukey, JW y Larsen, WA (1978) Variaciones de diagramas de caja. El estadístico estadounidense 32, 12-16.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.