Considere cualquier familia de escala de ubicación determinada por una distribución "estándar" ,F
ΩF={F(μ,σ):x→F(x−μσ)∣σ>0}.
Suponiendo que diferenciable, encontramos que los archivos PDF son .1F1σf((x−μ)/σ)dx
Truncar estas distribuciones para restringir su soporte entre y , , significa que los archivos PDF se reemplazan porb a < baba<b
f(μ,σ;a,b)(x)=f(x−μσ)dxσC(μ,σ,a,b),a≤x≤b
(y son cero para todos los demás valores de ) donde es el factor de normalización necesario para garantizar que integre a la unidad. (Tenga en cuenta que es idénticamente en ausencia de truncamiento). Por lo tanto, la probabilidad de registro para los datos de iid esxC(μ,σ,a,b)=F(μ,σ)(b)−F(μ,σ)(a)f(μ,σ;a,b)C1xi
Λ(μ,σ)=∑i[logf(xi−μσ)−logσ−logC(μ,σ,a,b)].
Los puntos críticos (incluidos los mínimos globales) se encuentran donde (un caso especial que ignoraré aquí) o el gradiente desaparece. Usando subíndices para denotar derivados, podemos calcular formalmente el gradiente y escribir las ecuaciones de probabilidad comoσ=0
00=∂Λ∂μ=∂Λ∂σ=∑i⎡⎣⎢−fμ(xi−μσ)f(xi−μσ)−Cμ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥=∑i⎡⎣⎢−fσ(xi−μσ)σ2f(xi−μσ)−1σ−Cσ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥
Debido a y son fijos, soltarlos de la notación y escribir como y como . (Sin truncamiento, ambas funciones serían idénticamente cero). Separar los términos que involucran los datos del resto daabnCμ(μ,σ,a,b)/C(μ,σ,a,b)A(μ,σ)nCσ(μ,σ,a,b)/C(μ,σ,a,b)B(μ,σ)
−A(μ,σ)−σ2B(μ,σ)−nσ=∑ifμ(xi−μσ)f(xi−μσ)=∑ifσ(xi−μσ)f(xi−μσ)
Al compararlos con la situación de no truncamiento, es evidente que
Cualquier estadística suficiente para el problema original es suficiente para el problema truncado (porque los lados derechos no han cambiado).
Nuestra capacidad de encontrar soluciones de forma cerrada se basa en la manejabilidad de y . Si estos no involucran y de manera simple, no podemos esperar obtener soluciones de forma cerrada en general.ABμσ
Para el caso de una familia normal, por supuesto, viene dada por el PDF normal acumulativo, que es una diferencia de las funciones de error: no existe la posibilidad de que una solución de forma cerrada pueda ser obtenido en general. Sin embargo, solo hay dos estadísticas suficientes (la media y la varianza de la muestra funcionarán) y el CDF es lo más uniforme posible, por lo que las soluciones numéricas serán relativamente fáciles de obtener.C(μ,σ,a,b)