¿Cuándo usar la mediana de muestra como estimador para la mediana de una distribución lognormal?


8

Yo mismo siempre usaría la media geométrica para estimar una mediana lognormal. Sin embargo, en el mundo de la industria, a veces usar la mediana de la muestra da mejores resultados. Por lo tanto, la pregunta es, ¿existe un rango / punto de corte a partir del cual la mediana de la muestra se pueda usar de manera confiable como un estimador para la mediana de la población?

Además, la media geométrica de la muestra es MLE para la mediana, pero no imparcial. Un estimador imparcial sería si se conoce . En la práctica, se usa un estimador corregido sesgado (ver más abajo) ya que es siempre desconocido. Hay documentos que dicen que este estimador de geomeano con corrección de sesgo es mejor debido a MSE más pequeño e imparcialidad. Sin embargo, en realidad, cuando solo tenemos un tamaño de muestra de 4 a 6, ¿puedo argumentar que la corrección de sesgo no tiene sentido ya queβ^CGM0=exp(μ^σ2/2N)σβ^CGMσ

  1. La imparcialidad significa que el estimador se centra en el parámetro de población real, ni debajo ni sobreestimado el parámetro. Para una distribución sesgada positivamente, el centro es la mediana, no la media.
  2. Invariante a la transformación es una propiedad importante en mi área actual (transformación entre DT50 y la tasa de degradación k, k = log (2) / DT50). Obtendrá diferentes resultados basados ​​en los datos originales y en los datos transformados.
  3. Para un tamaño de muestra limitado, la imparcialidad media es potencialmente engañosa. El sesgo no es error, un estimador imparcial puede dar un error mayor. Desde un punto de vista bayesiano, los datos son conocidos y fijos, el MLE maximiza la probabilidad de observar los datos, mientras que la corrección de sesgo se basa en parámetros fijos.

El estimador geométrico medio muestral es MLE, medianamente imparcial, invariante a las transformaciones. Creo que debería preferirse al estimador geométrico con corrección de sesgo. Estoy en lo cierto?

Asumiendo X1,X2,...,XnorteLN(μ,σ2)

β=Exp(μ)

β^GM=Exp(μ^)=Exp(Iniciar sesión(Xyo)norte)LN(μ,σ2/ /norte)

β^SM=mediana(X1,X2,...,Xnorte)

β^CGM=Exp(μ^-σ^2/ /2norte)

donde, y son el log-mean y log-sd, y son los MLE para y .μσμ^σ^μσ

Una pregunta relacionada: para la varianza de la mediana de la muestra, hay una fórmula aproximada ; ¿Cuál es un tamaño de muestra lo suficientemente grande como para usar esta fórmula?14 4norteF(metro)2


Tu expresión para β^CGM no tiene un sombrero en el σ2. ¿Eso significa que asumeσ2¿es conocida? Eso parece hacer que no sea muy útil.
Hong Ooi

lo siento, debería ser σ^2
Zhenglei

2
No está claro cuáles son sus estimadores porque no ha definido μ^ o σ^. La principal preocupación acerca de los modelos lognormales y las muestras pequeñas es que los estimadores basados ​​en lognormal son sensibles a la suposición lognormal, por lo que a menos que tenga una buena evidencia de que esta suposición es correcta, generalmente es mejor utilizar estimadores robustos alternativos.
whuber

@whuber, μ^ y σ^son los MLE Estoy de acuerdo con la preocupación de la suposición lognormal. En mi área de trabajo actual, el supuesto lognormal es una práctica estándar y es aceptado por las autoridades. Entonces, todas mis preguntas se basan en que la suposición lognormal es correcta.
Zhenglei

2
no, el μ y σson el log-mean y log-sd, no el mean y sd para lognormal. Editaré la pregunta para que quede clara.
Zhenglei

Respuestas:


3

Aparentemente, el concepto de imparcialidad ya se ha discutido hace mucho tiempo. Creo que es un tema de debate, ya que la imparcialidad media es un requisito estándar para un buen estimador, pero para una muestra pequeña no significa tanto como en las estimaciones de muestra grande.

Publico estas dos referencias como respuesta a mi segunda pregunta en la publicación.

Brown, George W. "Sobre la estimación de muestras pequeñas". Los Anales de Estadística Matemática, vol. 18, no. 4 (diciembre de 1947), págs. 582–585. JSTOR 2236236.

Lehmann, EL "Un concepto general de imparcialidad" The Annals of Mathematical Statistics, vol. 22, no. 4 (diciembre de 1951), págs. 587–592. JSTOR 2236928

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.