Muchas personas (aparte de los expertos especialistas) que piensan que son frecuentistas son, de hecho, bayesianas. Esto hace que el debate sea un poco inútil. Creo que el bayesianismo ganó, pero que todavía hay muchos bayesianos que piensan que son frecuentistas. Hay algunas personas que piensan que no usan priors y, por lo tanto, piensan que son frecuentas. Esta es una lógica peligrosa. Esto no se trata tanto de antecedentes (anteriores uniformes o no uniformes), la diferencia real es más sutil.
(No estoy formalmente en el departamento de estadística; mi formación es matemática e informática. Estoy escribiendo debido a las dificultades que he tenido para tratar de discutir este 'debate' con otros no estadísticos, e incluso con algunos de los primeros años de mi carrera estadísticos)
El MLE es en realidad un método bayesiano. Algunas personas dirán "Soy frecuente porque uso el MLE para estimar mis parámetros". He visto esto en literatura revisada por pares. Esto no tiene sentido y se basa en este mito (no dicho, pero implícito) de que un frecuentista es alguien que usa un prior uniforme en lugar de un prior no uniforme).
μ = 0θ
X≡ N( μ = 0 , σ2= θ )
XθθX
F( x , θ ) = Pσ2= θ( X= x ) = 12 πθ√mi- x22 θ
Xθ
θθX
Esta distinción entre los cortes horizontales y verticales es crucial, y descubrí que esta analogía me ayudó a comprender el enfoque frecuentista del sesgo .
Un bayesiano es alguien que dice
θF( x , θ )
sol( θ )
θF( x , θ ) g( θ )
Entonces, un Bayesiano corrige x y mira el corte vertical correspondiente en ese diagrama de contorno (o en el diagrama de variantes que incorpora el anterior). En este segmento, el área debajo de la curva no necesita ser 1 (como dije antes). Un intervalo bayesiano de 95% creíble (IC) es el intervalo que contiene el 95% del área disponible. Por ejemplo, si el área es 2, entonces el área bajo el CI bayesiano debe ser 1.9.
θ
θ
norte( μ = 0 , σ2= θ )θX- 3 θ√+ 3 θ√
θ
Esta no es la única forma de construir el CI frecuente, ni siquiera es bueno (estrecho), pero tengan paciencia conmigo por un momento.
La mejor manera de interpretar la palabra 'intervalo' no es como un intervalo en una línea 1-d, sino pensarlo como un área en el plano 2-d anterior. Un 'intervalo' es un subconjunto del plano 2-d, no de ninguna línea 1-d. Si alguien propone tal 'intervalo', entonces tenemos que probar si el 'intervalo' es válido a un nivel de confianza / credibilidad del 95%.
Un frecuentista verificará la validez de este 'intervalo' al considerar cada corte horizontal a su vez y mirar el área debajo de la curva. Como dije antes, el área bajo esta curva siempre será una. El requisito crucial es que el área dentro del 'intervalo' sea al menos 0,95.
Un Bayesiano verificará la validez al mirar las rebanadas verticales. Nuevamente, el área debajo de la curva se comparará con la subárea que está debajo del intervalo. Si el último es al menos el 95% del primero, entonces el "intervalo" es un intervalo bayesiano creíble válido del 95%.
Ahora que sabemos cómo probar si un intervalo particular es 'válido', la pregunta es cómo elegimos la mejor opción entre las opciones válidas. Esto puede ser un arte negro, pero generalmente desea el intervalo más estrecho. Ambos enfoques tienden a coincidir aquí: se consideran los cortes verticales y el objetivo es hacer que el intervalo sea lo más estrecho posible dentro de cada corte vertical.
No he intentado definir el intervalo de confianza frecuentista más estrecho posible en el ejemplo anterior. Vea los comentarios de @cardinal a continuación para ver ejemplos de intervalos más estrechos. Mi objetivo no es encontrar los mejores intervalos, sino enfatizar la diferencia entre los cortes horizontales y verticales para determinar la validez. Un intervalo que satisfaga las condiciones de un intervalo de confianza frecuentista del 95% generalmente no satisfará las condiciones de un intervalo creíble bayesiano del 95%, y viceversa.
Ambos enfoques desean intervalos estrechos, es decir, al considerar un corte vertical, queremos que el intervalo (1-d) en ese corte sea lo más estrecho posible. La diferencia está en cómo se aplica el 95%: un frecuentista solo mirará los intervalos propuestos donde el 95% del área de cada corte horizontal está por debajo del intervalo, mientras que un Bayesiano insistirá en que cada corte vertical sea tal que el 95% de su área esté debajo del intervalo
Muchos no estadísticos no entienden esto y se centran solo en los cortes verticales; esto los hace bayesianos incluso si piensan lo contrario.