"La mayoría de los hombres son más rápidos que la mayoría de las mujeres" es potencialmente un poco ambiguo, pero normalmente interpretaría que la intención es que si observamos emparejamientos aleatorios, la mayoría de las veces el hombre sería más rápido, es decir, para aleatorio (donde es 'tiempo para el -ésimo macho', etc.).P(Mi<Fj)>12i,jMii
Por supuesto, son posibles otras interpretaciones de la frase (después de todo, esa es la ambigüedad) y algunas de esas otras posibilidades podrían ser consistentes con su razonamiento.
[También tenemos el problema de si estamos hablando de muestras o poblaciones ... "la mayoría de los hombres [...] la mayoría de las mujeres" parece ser una declaración de población (sobre una población de tiempos potenciales) pero solo hemos observado tiempos que parece que estamos tratando como una muestra, por lo que debemos tener cuidado con la amplitud de la afirmación.]
Tenga en cuenta que no está implícito en . Pueden ir en direcciones opuestas.P(Mi<Fj)>12M˜<F˜
[No digo que te equivoques al pensar que la proporción de parejas de MF aleatorias en las que el hombre era más rápido que la mujer es más de 1/2; es casi seguro que tienes razón. Solo digo que no puedes decirlo comparando medianas. Tampoco puede decirlo observando la proporción en cada muestra por encima o por debajo de la mediana de la otra muestra. Tendrías que hacer una comparación diferente.]
Es decir, mientras que el hombre promedio puede ser más rápido que la mujer mediana, es posible tener una muestra de tiempos (o una distribución continua de tiempos, en ese caso) donde la posibilidad de que un hombre aleatorio sea más rápido que una mujer aleatoria es menos de . En muestras grandes, las dos indicaciones opuestas pueden ser significativas.12
Ejemplo:
Conjunto de datos A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
Conjunto de datos B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
Conjunto de datos C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(Los datos están aquí , pero se están utilizando para un propósito diferente allí; para mi recuerdo, yo mismo los generé)
Tenga en cuenta que la proporción de A <B es 2/3, la proporción de A <C es 5/9 y la proporción de B <C es 2/3. Tanto A vs B como B vs C son significativos al nivel del 5%, pero podemos lograr cualquier nivel de importancia simplemente agregando suficientes copias de las muestras. Incluso podemos evitar lazos, duplicando las muestras pero agregando una fluctuación suficientemente pequeña (lo suficientemente más pequeña que el espacio más pequeño entre los puntos)
Las medianas de muestra van en la otra dirección: mediana (A)> mediana (B)> mediana (C)
Una vez más, podríamos lograr importancia para alguna comparación de medianas, a cualquier nivel de importancia, repitiendo las muestras.
Para relacionarlo con el problema actual, imagine que A es "tiempos de mujeres" y B es "tiempos de hombres". Entonces el tiempo medio de los hombres es más rápido, pero un hombre elegido al azar será 2/3 de las veces más lento que una mujer elegida al azar.
Tomando nuestro ejemplo de las muestras A y C, podemos generar un conjunto de datos más grande (en R) de la siguiente manera:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
La mediana de F será de alrededor de 16.25, mientras que la mediana de M será de alrededor de 11.25, pero la proporción de casos donde F <M será de 5/9.
[Si reemplazamos el n / 3 con una variante binomial con los parámetros y
estaríamos muestras de una población donde la mediana de la distribución de F está en 16.25 mientras que la mediana de la distribución de M está en 11.25. Mientras tanto, en esa población, la probabilidad de que F <M vuelva a ser 5/9.]n13
Tenga en cuenta también que y while (por una distancia considerable).P(F<med(M))=23P(M>med(F))=23med(M)<med(F)