Yo mismo siempre usaría la media geométrica para estimar una mediana lognormal. Sin embargo, en el mundo de la industria, a veces usar la mediana de la muestra da mejores resultados. Por lo tanto, la pregunta es, ¿existe un rango / punto de corte a partir del cual la mediana de la muestra se pueda usar de manera confiable como un estimador para la mediana de la población?
Además, la media geométrica de la muestra es MLE para la mediana, pero no imparcial. Un estimador imparcial sería si se conoce . En la práctica, se usa un estimador corregido sesgado (ver más abajo) ya que es siempre desconocido. Hay documentos que dicen que este estimador de geomeano con corrección de sesgo es mejor debido a MSE más pequeño e imparcialidad. Sin embargo, en realidad, cuando solo tenemos un tamaño de muestra de 4 a 6, ¿puedo argumentar que la corrección de sesgo no tiene sentido ya que
- La imparcialidad significa que el estimador se centra en el parámetro de población real, ni debajo ni sobreestimado el parámetro. Para una distribución sesgada positivamente, el centro es la mediana, no la media.
- Invariante a la transformación es una propiedad importante en mi área actual (transformación entre DT50 y la tasa de degradación k, k = log (2) / DT50). Obtendrá diferentes resultados basados en los datos originales y en los datos transformados.
- Para un tamaño de muestra limitado, la imparcialidad media es potencialmente engañosa. El sesgo no es error, un estimador imparcial puede dar un error mayor. Desde un punto de vista bayesiano, los datos son conocidos y fijos, el MLE maximiza la probabilidad de observar los datos, mientras que la corrección de sesgo se basa en parámetros fijos.
El estimador geométrico medio muestral es MLE, medianamente imparcial, invariante a las transformaciones. Creo que debería preferirse al estimador geométrico con corrección de sesgo. Estoy en lo cierto?
Asumiendo
donde, y son el log-mean y log-sd, y son los MLE para y .
Una pregunta relacionada: para la varianza de la mediana de la muestra, hay una fórmula aproximada ; ¿Cuál es un tamaño de muestra lo suficientemente grande como para usar esta fórmula?