Estimadores de máxima verosimilitud para una distribución truncada


28

Considere muestras independientes obtiene a partir de una variable aleatoria que se supone que sigue una distribución truncada (por ejemplo, un truncado distribución normal ) de mínimo conocido (finito) y los valores máximos de y pero de parámetros desconocidos y . Si seguía una distribución no truncada, los estimadores de probabilidad máxima y para y de serían la media muestralS XNSXb μ sigma 2 X μ sigma 2 μ sigma 2 S μ = 1abμσ2Xμ^σ^2μσ2Sμ^=1NiSiy la varianza muestral . Sin embargo, para una distribución truncada, la varianza de la muestra definida de esta manera está limitada por por lo que no siempre es un estimador consistente: para , no puede converger en probabilidad a como va al infinito. Entonces parece que y no son los estimadores de máxima probabilidad de y para una distribución truncada. Por supuesto, esto es de esperar ya que y \ sigma ^ 2(b-a)2σ2>(b-a)2σ2N μ σ 2μσ2μσ2σ^2=1Ni(Siμ^)2(ba)2σ2>(ba)2σ2Nμ^σ^2μσ2μσ2 Los parámetros de una distribución normal truncada no son su media y varianza.

Entonces, ¿cuáles son los estimadores de máxima verosimilitud de los parámetros μ y σ de una distribución truncada de valores mínimos y máximos conocidos?


¿Estás seguro de tu análisis? Creo que está haciendo una suposición inválida: para la situación truncada, el MLE de σ2 ya no es la varianza de la muestra (y, en general, el MLE de μ ya no es la media de la muestra).
whuber

whuber: Lo sé, esta es precisamente mi pregunta: ¿cuáles son los MLE de σ2 y μ en el caso truncado? Agregar una oración para insistir en esto.
a3nm

1
No hay una solución de forma cerrada. Todo lo que puede hacer es minimizar numéricamente la probabilidad de registro. Pero esto no es cualitativamente diferente de muchos otros modelos, como la regresión logística, que tampoco tiene una solución de forma cerrada.
whuber

whuber: Si esto es cierto, esto es bastante decepcionante. ¿Tiene referencias sobre la falta de soluciones de forma cerrada? ¿Existen estimadores de forma cerrada que no tienen la máxima probabilidad pero que son al menos consistentes (y opcionalmente imparciales)?
a3nm

1
@whuber: ¿Puede al menos simplificar sus muestras en estadísticas suficientes para que la minimización sea rápida?
Neil G

Respuestas:


29

Considere cualquier familia de escala de ubicación determinada por una distribución "estándar" ,F

ΩF={F(μ,σ):xF(xμσ)σ>0}.

Suponiendo que diferenciable, encontramos que los archivos PDF son .1F1σf((xμ)/σ)dx

Truncar estas distribuciones para restringir su soporte entre y , , significa que los archivos PDF se reemplazan porb a < baba<b

f(μ,σ;a,b)(x)=f(xμσ)dxσC(μ,σ,a,b),axb

(y son cero para todos los demás valores de ) donde es el factor de normalización necesario para garantizar que integre a la unidad. (Tenga en cuenta que es idénticamente en ausencia de truncamiento). Por lo tanto, la probabilidad de registro para los datos de iid esxC(μ,σ,a,b)=F(μ,σ)(b)F(μ,σ)(a)f(μ,σ;a,b)C1xi

Λ(μ,σ)=i[logf(xiμσ)logσlogC(μ,σ,a,b)].

Los puntos críticos (incluidos los mínimos globales) se encuentran donde (un caso especial que ignoraré aquí) o el gradiente desaparece. Usando subíndices para denotar derivados, podemos calcular formalmente el gradiente y escribir las ecuaciones de probabilidad comoσ=0

0=Λμ=i[fμ(xiμσ)f(xiμσ)Cμ(μ,σ,a,b)C(μ,σ,a,b)]0=Λσ=i[fσ(xiμσ)σ2f(xiμσ)1σCσ(μ,σ,a,b)C(μ,σ,a,b)]

Debido a y son fijos, soltarlos de la notación y escribir como y como . (Sin truncamiento, ambas funciones serían idénticamente cero). Separar los términos que involucran los datos del resto daabnCμ(μ,σ,a,b)/C(μ,σ,a,b)A(μ,σ)nCσ(μ,σ,a,b)/C(μ,σ,a,b)B(μ,σ)

A(μ,σ)=ifμ(xiμσ)f(xiμσ)σ2B(μ,σ)nσ=ifσ(xiμσ)f(xiμσ)

Al compararlos con la situación de no truncamiento, es evidente que

  • Cualquier estadística suficiente para el problema original es suficiente para el problema truncado (porque los lados derechos no han cambiado).

  • Nuestra capacidad de encontrar soluciones de forma cerrada se basa en la manejabilidad de y . Si estos no involucran y de manera simple, no podemos esperar obtener soluciones de forma cerrada en general.ABμσ

Para el caso de una familia normal, por supuesto, viene dada por el PDF normal acumulativo, que es una diferencia de las funciones de error: no existe la posibilidad de que una solución de forma cerrada pueda ser obtenido en general. Sin embargo, solo hay dos estadísticas suficientes (la media y la varianza de la muestra funcionarán) y el CDF es lo más uniforme posible, por lo que las soluciones numéricas serán relativamente fáciles de obtener.C(μ,σ,a,b)


¡Muchas gracias por esta respuesta tan detallada! No estoy seguro de obtener lo que son , f σ , C μ y C σ , ¿podría definirlos? Además, es obvio, pero para ser precisos, quizás podría decir que su expresión para el pdf es para x [ a , b ] (y el pdf es cero fuera de eso). ¡Gracias de nuevo! fμfσCμCσx[a,b]
a3nm

1
La notación más larga habitual es , etc.: como se anunció, es una derivada. Haré el segundo cambio que sugieran porque es una aclaración importante, gracias. Cμ=μC(μ,σ,a,b)
whuber

Además, dado que su respuesta es más general que la que esperaba, edité mi pregunta para insistir menos en el caso de las distribuciones normales. Gracias de nuevo por tu esfuerzo.
a3nm

1
¡Era más fácil de explicar a este nivel de generalidad en comparación con centrarse en las distribuciones normales! Calcular las derivadas y mostrar la forma precisa del CDF son distracciones innecesarias (aunque útiles cuando se comienza a codificar la solución numérica).
whuber

1
Gracias por arreglar! Te perdiste uno de ellos; ¿podrías revisar mi edición?
a3nm
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.