Dado que el propósito aquí es presumiblemente obtener una estimación válida y útil de , la distribución previa debe ser coherente con la especificación de la distribución de la población de la que proviene la muestra. Esto NO significa de ninguna manera que "calculemos" el uso previo de la muestra en sí; esto anularía la validez de todo el procedimiento. Sí sabemos que la población de la que proviene la muestra es una población de variables aleatorias uniformes iid, cada una de las cuales varía en . Esta es una suposición mantenida y es parte de la información previa que poseemos (y no tiene nada que ver con la muestra , es decir, con la realización específica de un subconjunto de estas variables aleatorias).θ[0,θ]
Ahora suponga que esta población consta de variables aleatorias (mientras que nuestra muestra consta de realizaciones de variables aleatorias). La suposición mantenida nos dice que
mn<mn
maxi=1,...,n{Xi}≤maxj=1,...,m{Xj}≤θ
Denote para compacidad . Luego tenemos que también se puede escribir
maxi=1,...,n{Xi}≡X∗θ≥X∗
θ=cX∗c≥1
La función de densidad del de iid Uniform rv que varía en es
maxN[0,θ]
fX∗(x∗)=N(x∗)N−1θN
para el soporte y cero en otro lugar. Luego, usando y aplicando la fórmula de cambio de variable, obtenemos una distribución previa de que es consistente con el supuesto mantenido:
[0,θ]θ=cX∗θ
fp(θ)=N(θc)N−1θN1c=NcNθ−1θ∈[x∗,∞]
lo cual puede ser incorrecto si no especificamos la constante adecuadamente. Pero nuestro interés radica en tener un posterior apropiado para , y también, no queremos restringir los posibles valores de (más allá de la restricción implícita en el supuesto mantenido). Entonces dejamos indeterminado.
Luego escribiendo el posterior escθθc
X={x1,..,xn}
f(θ∣X)∝θ−NNcNθ−1⇒f(θ∣X)=ANcNθ−(N+1)
para alguna constante de normalización A. Queremos
∫Sθf(θ∣X)dθ=1⇒∫∞x∗ANcNθ−(N+1)dθ=1
⇒ANcN1−Nθ−N∣∣∞x∗=1⇒A=(cx∗)N
Inserción en la parte posterior
f(θ∣X)=(cx∗)NNcNθ−(N+1)=N(x∗)Nθ−(N+1)
Tenga en cuenta que la constante indeterminada de la distribución anterior se ha cancelado convenientemente.c
La parte posterior resume toda la información que la muestra específica puede darnos con respecto al valor de . Si queremos obtener un valor específico para , podemos calcular fácilmente el valor esperado de la parte posterior,
θθ
E(θ∣X)=∫∞x∗θN(x∗)Nθ−(N+1)dθ=−NN−1(x∗)Nθ−N+1∣∣∞x∗=NN−1x∗
¿Hay alguna intuición en este resultado? Bueno, a medida que aumenta el número de , lo más probable es que la realización máxima entre ellos sea cada vez más cercana a su límite superior, , que es exactamente lo que refleja el valor medio posterior de : si, por ejemplo , , pero si . Esto muestra que nuestra táctica con respecto a la selección de lo anterior fue razonable y consistente con el problema en cuestión, pero no necesariamente "óptima" en algún sentido.XθθN=2⇒E(θ∣X)=2x∗N=10⇒E(θ∣X)=109x∗