Esta es una afirmación habitual sobre la familia exponencial, pero en mi opinión, la mayoría de las veces se afirma de una manera que puede confundir al lector menos experimentado. Debido a que, tomado al pie de la letra, podría interpretarse como "si nuestra variable aleatoria sigue una distribución en la familia exponencial, entonces si tomamos una muestra y la insertamos en la estadística suficiente, obtendremos el verdadero valor esperado de la estadística ". Si solo fuera así ... Más sobre esto no tiene en cuenta el tamaño de la muestra, lo que puede causar más confusión.
La función de densidad exponencial es
fX(x)=h(x)eη(θ)T(x)e−A(θ)(1)
donde es la estadística suficiente.T(x)
Como esta es una densidad, tiene que integrarse a la unidad, entonces ( es el soporte de )SxX
∫Sxh(x)eη(θ)T(x)e−A(θ)dx=1(2)
Eq. cumple para all para que podamos diferenciar ambos lados con respecto a él:(2)θ
∂∂θ∫Sxh(x)eη(θ)T(x)e−A(θ)dx=∂(1)∂θ=0(3)
Intercambiando el orden de diferenciación e integración, obtenemos
∫Sx∂∂θ(h(x)eη(θ)T(x)e−A(θ))dx=0(4)
Realizando la diferenciación que tenemos
∂∂θ(h(x)eη(θ)T(x)e−A(θ))=fX(x)[T(x)η′(θ)−A′(θ)](5)
Al insertar en obtenemos(5)(4)
∫SxfX(x)[T(x)η′(θ)−A′(θ)]dx=0
⇒η′(θ)E[T(X)]−A′(θ)=0⇒E[T(X)]=A′(θ)η′(θ)(6)
Ahora preguntamos: el lado izquierdo de es un número real. Entonces, el lado derecho también debe ser un número real y no una función . Por lo tanto, debe evaluarse en un específico , y debe ser el "verdadero" , de lo contrario en el lado izquierdo no tendríamos el verdadero valor esperado de . Para enfatizar esto, denotamos el valor verdadero por , y reescribimos como(6)θθT(X)θ0(6)
Eθ0[T(X)]=A′(θ)η′(θ)∣∣θ=θ0(6a)
Pasamos ahora a la estimación de máxima verosimilitud . La probabilidad de registro para una muestra de tamaño esn
L(θ∣x)=∑i=1nlnh(xi)+η(θ)∑i=1nT(xi)−nA(θ)
Al establecer su derivada con respecto a igual a , obtenemos el MLEθ0
θ^(x):1n∑i=1nT(xi)=A′(θ)η′(θ)∣∣θ=θ^(x)(7)
Compare con . Los lados derechos no son iguales, ya que no podemos argumentar que el estimador MLE golpeó el valor verdadero. Entonces tampoco lo son los lados izquierdos. Pero recuerda que la ecuación. cumple para todos y también para también. Entonces los pasos en la ecuación. se pueden tomar con respecto a y así podemos escribir eq. para :(7)(6a)2 θθ^3,4,5,6θ^6aθ^
Eθ^(x)[T(X)]=A′(θ)η′(θ)∣∣θ=θ^(x)(6b)
que, combinado con , nos lleva a la relación válida(7)
Eθ^(x)[T(X)]=1n∑i=1nT(xi)
que es lo que realmente dice la afirmación bajo examen: el valor esperado de la estadística suficiente bajo el MLE para los parámetros desconocidos (en otras palabras, el valor del primer momento bruto de la distribución que obtendremos si usamos en lugar de ), es igual (y no solo se aproxima por) el promedio de la estadística suficiente calculada a partir de la muestra . θ^(x)θx
Además, solo si el tamaño de la muestra es entonces podríamos decir con precisión, "el valor esperado de la estadística suficiente bajo el MLE es igual a la estadística suficiente".n=1