Keith Winstein,
EDITAR: Solo para aclarar, esta respuesta describe el ejemplo dado en Keith Winstein Answer on the King con el cruel juego estadístico. Las respuestas bayesianas y frecuentes usan la misma información, que es ignorar la información sobre el número de monedas justas e injustas al construir los intervalos. Si no se ignora esta información, el frecuentador debe usar la Probabilidad Beta-Binomial integrada como la distribución de muestreo en la construcción del intervalo de Confianza, en cuyo caso el Intervalo de Confianza de Clopper-Pearson no es apropiado y necesita ser modificado. Un ajuste similar debería ocurrir en la solución bayesiana.
EDITAR: También he aclarado el uso inicial del clopper Pearson Interval.
EDITAR: por desgracia, mi alfa está al revés, y mi intervalo de clopper pearson es incorrecto. Mis más humildes disculpas a @whuber, quien correctamente señaló esto, pero con quien inicialmente no estuve de acuerdo e ignoré.
El CI que usa el método Clopper Pearson es muy bueno
θ
[Pr(Bi(1,θ)≥X)≥α2]∩[Pr(Bi(1,θ)≤X)≥α2]
X=1Pr(Bi(1,θ)≥1)=θPr(Bi(1,θ)≤1)=1θ≥α21≥α2X=1X=0Pr(Bi(1,θ)≥0)=1Pr(Bi(1,θ)≤0)=1−θ1−θ≥α2θ≤1−α2X=0[0.025,1]X=1[0,0.975]X=0
Por lo tanto, aquel que usa el intervalo de confianza Clopper Pearson nunca será decapitado. Al observar el intervalo, es básicamente todo el espacio de parámetros. ¡Pero el intervalo CP está haciendo esto al dar una cobertura del 100% a un intervalo supuestamente del 95%! Básicamente, los Frequentistas "hacen trampa" al dar un intervalo de confianza del 95% más cobertura de la que se le pidió que diera (aunque ¿quién no haría trampa en tal situación? Si fuera yo, yo daría todo [0, 1] intervalo). Si el rey pidiera un IC exacto del 95%, este método frecuentista fallaría independientemente de lo que realmente sucediera (¿tal vez existe uno mejor?).
¿Qué pasa con el intervalo bayesiano? (específicamente el Intervalo Bayesiano de la Desnidad Posterior Más Alta (HPD))
(θ|X)∼Beta(1+X,2−X)Pr(θ≥θe|x=1)=1−(θe)2Pr(θ≤θe|x=0)=1−(1−θe)2θe=0.05−−−−√≈0.224X=1θe=1−0.05−−−−√≈0.776X=0(0,0.776)X=0(0.224,1)X=1
11012+1×110≈0
0.1
0.0250.975
Para citar un intervalo de confianza genuino del 95%, entonces, por definición , debería haber algunos casos (es decir, al menos uno) del intervalo observado que no contienen el valor verdadero del parámetro . De lo contrario, ¿cómo se puede justificar la etiqueta del 95%? ¿No sería válido o inválido llamarlo un intervalo del 90%, 50%, 20% o incluso 0%?
No veo cómo simplemente decir "realmente significa 95% o más" sin una restricción complementaria es satisfactorio. Esto se debe a que la solución matemática obvia es todo el espacio de parámetros, y el problema es trivial. ¿y si quiero un CI del 50%? si solo limita los falsos negativos, todo el espacio de parámetros es un CI válido que utiliza solo este criterio.
100%X=0100×1012+9101012+1%>95%X=1
Para terminar, parece un poco extraño pedir un intervalo de incertidumbre, y luego evaluar ese intervalo utilizando el valor verdadero del que no estábamos seguros. Una comparación "más justa", tanto para la confianza como para los intervalos creíbles, me parece la verdad de la declaración de incertidumbre dada con el intervalo .