La idea clave es que la distribución muestral de la mediana es simple de expresar en términos de la función de distribución pero más complicada de expresar en términos del valor de la mediana. Una vez que comprendamos cómo la función de distribución puede volver a expresar valores como probabilidades y viceversa, es fácil derivar la distribución de muestreo exacta de la mediana. Se necesita un pequeño análisis del comportamiento de la función de distribución cerca de su mediana para mostrar que esto es asintóticamente Normal.
(El mismo análisis funciona para la distribución de muestreo de cualquier cuantil, no solo la mediana).
No haré ningún intento de ser riguroso en esta exposición, pero lo llevo a cabo en pasos que se justifican fácilmente de manera rigurosa si tienes la intención de hacerlo.
Intuición
Estas son instantáneas de una caja que contiene 70 átomos de un gas atómico caliente:
En cada imagen he encontrado una ubicación, que se muestra como una línea vertical roja, que divide los átomos en dos grupos iguales entre la izquierda (dibujada como puntos negros) y la derecha (puntos blancos). Esta es una mediana de las posiciones: 35 de los átomos se encuentran a su izquierda y 35 a su derecha. Las medianas cambian porque los átomos se mueven aleatoriamente alrededor de la caja.
Estamos interesados en la distribución de esta posición intermedia. Tal pregunta se responde invirtiendo mi procedimiento: primero dibujemos una línea vertical en algún lugar, digamos en la ubicación . ¿Cuál es la posibilidad de que la mitad de los átomos estén a la izquierda de y la otra mitad a su derecha? Los átomos a la izquierda individualmente tenían posibilidades de que estuviera a la izquierda. Los átomos a la derecha individualmente tenían posibilidades de que estuviera a la derecha. Suponiendo que sus posiciones son estadísticamente independientes, las posibilidades se multiplican, dando para la posibilidad de esta configuración particular. Se podría lograr una configuración equivalente para una división diferente de los átomos en dosx x 1 - x x 35 ( 1 - x ) 35 70 35xxx1−xx35(1−x)357035-piezas de elementos. Agregar estos números para todas las divisiones posibles da la posibilidad de
Pr(x is a median)=Cxn/2(1−x)n/2
donde es el número total de átomos y es proporcional al número de divisiones de átomos en dos subgrupos iguales.C nnCn
Esta fórmula identifica la distribución de la mediana como un Beta de distribución(n/2+1,n/2+1) .
Ahora considere una caja con una forma más complicada:
Una vez más las medianas varían. Debido a que la caja está baja cerca del centro, no hay mucho de su volumen allí: un pequeño cambio en el volumen ocupado por la mitad izquierda de los átomos (los negros una vez más), o bien, podríamos admitirlo, el área a la izquierda, como se muestra en estas figuras, corresponde a un cambio relativamente grande en la posición horizontal de la mediana. De hecho, debido a que el área subtendida por una pequeña sección horizontal de la caja es proporcional a la altura allí, los cambios en las medianas se dividen por la altura de la caja. Esto hace que la mediana sea más variable para este cuadro que para el cuadro cuadrado, porque este es mucho más bajo en el medio.
En resumen, cuando medimos la posición de la mediana en términos de área (a la izquierda y a la derecha), el análisis original (para un cuadro cuadrado) permanece sin cambios. La forma de la caja solo complica la distribución si insistimos en medir la mediana en términos de su posición horizontal. Cuando lo hacemos, la relación entre el área y la representación de la posición es inversamente proporcional a la altura del cuadro.
Hay más para aprender de estas imágenes. Está claro que cuando hay pocos átomos en (cualquiera) de las cajas, hay una mayor probabilidad de que la mitad de ellos pueda terminar accidentalmente agrupados lejos a ambos lados. A medida que crece el número de átomos, disminuye el potencial de un desequilibrio tan extremo. Para rastrear esto, tomé "películas", una larga serie de 5000 cuadros, para la caja curva llena de , luego con , luego , y finalmente con átomos, y noté las medianas. Aquí hay histogramas de las posiciones medias:15 75 37531575375
Claramente, para un número suficientemente grande de átomos, la distribución de su posición media comienza a verse en forma de campana y se estrecha: eso parece un resultado del Teorema del límite central, ¿no?
Resultados cuantitativos
El "cuadro", por supuesto, representa la densidad de probabilidad de alguna distribución: su parte superior es el gráfico de la función de densidad (PDF). Por lo tanto, las áreas representan probabilidades. Colocar puntos al azar e independientemente dentro de un cuadro y observar sus posiciones horizontales es una forma de extraer una muestra de la distribución. (Esta es la idea detrás del muestreo de rechazo ) .n
La siguiente figura conecta estas ideas.
Esto parece complicado, pero en realidad es bastante simple. Aquí hay cuatro parcelas relacionadas:
La gráfica superior muestra el PDF de una distribución junto con una muestra aleatoria de tamaño . Los valores mayores que la mediana se muestran como puntos blancos; valores menores que la mediana como puntos negros. No necesita una escala vertical porque sabemos que el área total es la unidad.n
La gráfica central es la función de distribución acumulativa para la misma distribución: usa la altura para denotar la probabilidad. Comparte su eje horizontal con la primera parcela. Su eje vertical debe ir de a porque representa las probabilidades.101
El diagrama de la izquierda está destinado a leerse de lado: es el PDF de la distribución Beta . Muestra cómo variará la mediana en el cuadro, cuando la mediana se mide en términos de áreas a la izquierda y derecha del centro (en lugar de medirse por su posición horizontal). Dibujé puntos aleatorios de este PDF, como se muestra, y los conecté con líneas discontinuas horizontales a las ubicaciones correspondientes en el CDF original: así es como los volúmenes (medidos a la izquierda) se convierten en posiciones (medidos en la parte superior central) y gráficos inferiores). Uno de estos puntos corresponde en realidad a la mediana que se muestra en la gráfica superior; He dibujado una línea vertical sólida para mostrar eso.16(n/2+1,n/2+1)16
La gráfica inferior es la densidad de muestreo de la mediana, medida por su posición horizontal. Se obtiene al convertir el área (en el diagrama de la izquierda) a la posición. La fórmula de conversión viene dada por el inverso del CDF original: ¡esta es simplemente la definición del CDF inverso! (En otras palabras, el CDF convierte la posición en área a la izquierda; el CDF inverso vuelve a convertir el área en posición). He trazado líneas verticales discontinuas que muestran cómo los puntos aleatorios del gráfico izquierdo se convierten en puntos aleatorios dentro del gráfico inferior . Este proceso de leer de un lado a otro nos dice cómo ir de un área a otra.
Sea el CDF de la distribución original (diagrama central) y el CDF de la distribución Beta. Para encontrar la posibilidad de que la mediana se encuentre a la izquierda de alguna posición , primero use para obtener el área a la izquierda de en el cuadro: esto es . La distribución Beta a la izquierda nos dice la posibilidad de que la mitad de los átomos se encuentren dentro de este volumen, dando : este es el CDF de la posición media . Para encontrar su PDF (como se muestra en la gráfica inferior), tome la derivada:FGxFxF(x)G(F(x))
ddxG(F(x))=G′(F(x))F′(x)=g(F(x))f(x)
donde es el PDF (gráfico superior) es el PDF Beta (gráfico izquierdo).fg
Esta es una fórmula exacta para la distribución de la mediana para cualquier distribución continua. (Con cierto cuidado en la interpretación se puede aplicar a cualquier distribución, sea continua o no).
Resultados asintóticos
Cuando es muy grande y no tiene un salto en su mediana, la mediana de la muestra debe variar estrechamente alrededor de la mediana verdadera de la distribución. Suponiendo también que el PDF es continuo cerca de , en la fórmula anterior no cambiará mucho de su valor en dado por Además, tampoco cambiará mucho de su valor allí: al primer orden,nFμfμ f(x)μ,f(μ).F
F(x)=F(μ+(x−μ))≈F(μ)+F′(μ)(x−μ)=1/2+f(μ)(x−μ).
Por lo tanto, con una aproximación cada vez mejor a medida que crece,n
g(F(x))f(x)≈g(1/2+f(μ)(x−μ))f(μ).
Eso es simplemente un cambio de la ubicación y la escala de la distribución Beta. El cambio de escala entre dividirá su varianza entre (¡que será mejor que no sea cero!). Por cierto, la varianza de Beta está muy cerca de .f(μ)f(μ)2(n/2+1,n/2+1)n/4
Este análisis puede verse como una aplicación del Método Delta .
Finalmente, Beta es aproximadamente Normal para grande . Hay muchas formas de ver esto; quizás lo más simple es mirar el logaritmo de su PDF cerca de :(n/2+1,n/2+1)n1/2
log(C(1/2+x)n/2(1/2−x)n/2)=n2log(1−4x2)+C′=C′−2nx2+O(x4).
(Las constantes y simplemente normalizan el área total a la unidad.) A través del tercer orden en , esto es lo mismo que el registro del PDF normal con varianza (Este argumento se hace riguroso mediante el uso de funciones generadoras características o acumulativas en lugar del registro del PDF).CC′x,1/(4n).
En conjunto, concluimos que
La distribución de la mediana de la muestra tiene una varianza de aproximadamente ,1/(4nf(μ)2)
y es aproximadamente Normal para grande ,n
todo siempre que el PDF sea continuo y distinto de cero en la medianafμ.