Ejemplos de enfoques bayesianos y frecuentistas que dan diferentes respuestas

54

Nota: Soy consciente de las diferencias filosóficas entre las estadísticas bayesianas y frecuentistas.

Por ejemplo, "cuál es la probabilidad de que la moneda en la mesa sea cara" no tiene sentido en las estadísticas frecuentistas, ya que ya ha caído cara o cruz, no hay nada probabilístico al respecto. Entonces la pregunta no tiene respuesta en términos frecuentistas.

Pero esa diferencia es una específicamente no el tipo de diferencia que estoy preguntando.

Más bien, me gustaría saber cómo sus predicciones para preguntas bien formadas realmente difieren en el mundo real, excluyendo cualquier diferencia teórica / filosófica como el ejemplo que mencioné anteriormente.

En otras palabras:

¿Cuál es un ejemplo de una pregunta , que responda tanto en estadísticas frecuentistas como bayesianas, cuya respuesta es diferente entre los dos?

(por ejemplo, tal vez uno de ellos responde "1/2" a una pregunta en particular, y el otro responde "2/3".)

¿Hay alguna diferencia?

Si es así, ¿cuáles son algunos ejemplos?
Si no es así, ¿cuándo hace alguna diferencia si uso estadísticas bayesianas o frecuentistas para resolver un problema en particular?
¿Por qué debería evitar uno a favor del otro?

bayesian frequentist

— Mehrdad
fuente

8

John Kruschke acaba de producir dos videos donde compara los métodos estadísticos bayesianos y estándar. Tiene muchos ejemplos donde el método bayesiano rechaza pero el método estándar no. Tal vez no sea exactamente lo que estaba buscando, pero de todos modos ... youtu.be/YyohWpjl6KU y youtu.be/IhlSD-lIQ_Y .

— Rasmus Bååth el

44

La distribución binomial proporciona otro ejemplo donde la inferencia frecuentista (basada en la probabilidad) y la inferencia bayesiana difieren en algunos casos. La probabilidad de perfil del parámetro

no disminuye a

como

( ver ) para algunas muestras. Esto implica que algunos intervalos de probabilidad-confianza tienen una longitud infinita. Por otro lado, la distribución posterior marginal de

siempre decae a

como

dado que es integrable.

N

$N$

0

$0$

N \to \infty

$N\rightarrow \infty$

N

$N$

0

$0$

N \to \infty

$N\rightarrow\infty$

@Procrastinator: Gracias, estoy viendo las diapositivas mencionadas en este momento. Esto parece un poco más intenso que mi formación matemática, pero espero sacar algo de eso. :)

— Mehrdad

2

Es posible que desee echar un vistazo al ejemplo de Stone. Lo explico en mi blog aquí: normaldeviate.wordpress.com/2012/12/08/…

— Larry Wasserman

1

@mbq: Solo me pregunto, ¿por qué se hizo esto wiki comunitario?

— Mehrdad

9

Este ejemplo está tomado de aquí . (Incluso creo que obtuve este enlace de SO, pero ya no puedo encontrarlo).

Se ha lanzado una moneda veces, apareciendo caras veces. Si se va a lanzar dos veces más, ¿apostaría por dos caras? Suponga que no puede ver el resultado del primer lanzamiento antes del segundo lanzamiento (y también está condicionado independientemente a ), por lo que no puede actualizar su opinión sobre entre los dos lanzamientos. $n=14$ $k=10$ $\theta$ $\theta$

F (y_{F, 1} = cabezas, y_{F, 2} = cabezas El | θ) = F (y_{F, 1} = cabezas) F (y_{F, 2} = cabezas El | θ) = θ^{2} .

$f(y_{f,1}=\text{heads},y_{f,2}=\text{heads}|\theta)=f(y_{f,1}=\text{heads})f(y_{f,2}=\text{heads}|\theta)=\theta^2.$

Beta (α_{0}, β_{0})

$\text{Beta}(\alpha_0,\beta_0)$

\begin{array}{rcl} F (y_{F, 1} = cabezas, y_{F, 2} = cabezas El | y) & = & \int F (y_{F, 1} = cabezas, y_{F, 2} = cabezas El | θ) π (θ El | y) re θ \\ = & \frac{Γ (α_{0 0} + β_{0 0} + norte)}{Γ (α_{0 0} + k) Γ (β_{0 0} + norte - k)} \int θ^{2} θ^{α_{0 0} + k - 1} {(1 - θ)}^{β_{0 0} + norte - k - 1} re θ \\ = & \frac{Γ (α_{0 0} + β_{0 0} + norte)}{Γ (α_{0 0} + k) Γ (β_{0 0} + norte - k)} \frac{Γ (α_{0 0} + k + 2) Γ (β_{0 0} + norte - k)}{Γ (α_{0 0} + β_{0 0} + norte + 2)} \\ = & \frac{(α_{0 0} + k) \cdot (α_{0 0} + k + 1)}{(α_{0 0} + β_{0 0} + norte) \cdot (α_{0 0} + β_{0 0} + norte + 1)} \end{array}

$\begin{eqnarray*} f(y_{f,1}=\text{heads},y_{f,2}=\text{heads}|y)&=&\int f(y_{f,1}=\text{heads},y_{f,2}=\text{heads}|\theta)\pi(\theta|y)d\theta\notag\\ &=&\frac{\Gamma\left(\alpha _{0}+\beta_{0}+n\right)}{\Gamma\left(\alpha_{0}+k\right)\Gamma\left(\beta_{0}+n-k\right)}\int \theta^2\theta ^{\alpha _{0}+k-1}\left( 1-\theta \right) ^{\beta _{0}+n-k-1}d\theta\notag\\ &=&\frac{\Gamma\left(\alpha_{0}+\beta_{0}+n\right)}{\Gamma\left(\alpha_{0}+k\right)\Gamma\left(\beta_{0}+n-k\right)}\frac{\Gamma\left(\alpha_{0}+k+2\right)\Gamma\left(\beta_{0}+n-k\right)}{\Gamma\left(\alpha_{0}+\beta_{0}+n+2\right)}\notag\\ &=&\frac{(\alpha_{0}+k)\cdot(\alpha_{0}+k+1)}{(\alpha_{0}+\beta_{0}+n)\cdot(\alpha_{0}+\beta_{0}+n+1)} \end{eqnarray*}$

Beta (1, 1)

$\text{Beta}(1, 1)$

(10 / 14)^{2} \approx .51

$(10/14)^2\approx.51$

— Christoph Hanck
fuente

+1 exactamente el tipo de respuesta que estaba buscando, gracias.

— Mehrdad

55

En realidad, hubo una actualización de la publicación a la que se hace referencia en la respuesta ... Aunque dejó la publicación arriba, "en lugar de usar la distribución uniforme como una prioridad, podemos ser aún más agnósticos. En este caso, podemos usar la Beta ( 0,0) distribución como anterior. Dicha distribución corresponde al caso en el que cualquier media de la distribución es igualmente probable. En este caso, los dos enfoques, bayesiano y frecuentista dan los mismos resultados ". !!! ¡Entonces todavía necesitamos un ejemplo para responder esta pregunta! Por lo tanto, +1 a la respuesta a continuación como la verdadera respuesta a esta pregunta.

— user1745038

10

Vea mi pregunta aquí , que menciona un artículo de Edwin Jaynes que da un ejemplo de un intervalo de confianza frecuentista correctamente construido, donde hay suficiente información en la muestra para saber con certeza que el verdadero valor de la estadística no se encuentra en ninguna parte del intervalo de confianza ( y, por lo tanto, el intervalo de confianza es diferente del intervalo bayesiano creíble).

Sin embargo, la razón de esto es la diferencia en la definición de un intervalo de confianza y un intervalo creíble, que a su vez es una consecuencia directa de la diferencia en las definiciones de probabilidad frecuentista y bayesiana. Si le pide a un Bayesiano que produzca un intervalo de confianza Bayesiano (en lugar de creíble), entonces sospecho que siempre habrá un previo para el cual los intervalos serán los mismos, por lo que las diferencias se reducen a la elección del previo.

Si los métodos frecuentistas o bayesianos son apropiados depende de la pregunta que desee plantear, y al final del día es la diferencia en las filosofías la que decide la respuesta (siempre que el esfuerzo computacional y analítico requerido no sea una consideración).

Al ser algo irónico, se podría argumentar que una frecuencia a largo plazo es una forma perfectamente razonable de determinar la plausibilidad relativa de una proposición, en cuyo caso las estadísticas frecuentistas son un subconjunto ligeramente extraño de bayesianismo subjetivo, por lo que cualquier pregunta que un frecuentador pueda responder Un bayesiano subjetivista también puede responder de la misma manera, o de alguna otra manera si eligen diferentes antecedentes. ; o)

— Dikran Marsupial
fuente

44

El uso de "bayesiano subjetivo" es un poco de auto-sabotaje ( ver ). El modelado en general está lleno de subjetivismo, la elección de una distribución para modelar una muestra también es subjetiva. Incluso la elección de una prueba de bondad de ajuste para verificar si cierto modelo es razonable es subjetiva.

2

Realmente no estoy de acuerdo con eso, si alguien considera que "subjetivo" es peryorativo, ese es su error. A veces, cuando queremos decir probabilidad, realmente queremos decir creencia personal subjetiva: no veo ninguna razón para no llamarlo así, si eso es lo que realmente significa (elegir aceptar solo frecuencias de largo plazo ya que la definición de probabilidad es una opción puramente subjetiva).

— Dikran Marsupial

1

+1 gracias por el enlace, es muy esclarecedor. Y también para la nota sobre la diferencia entre confianza e intervalos creíbles también.

— Mehrdad

8

Creo que este documento proporciona un sentido más decidido de las compensaciones en las aplicaciones reales entre los dos. Parte de esto podría deberse a mi preferencia por los intervalos en lugar de las pruebas.

Gustafson, P. y Groenlandia, S. (2009). Estimación de intervalo para datos de observación desordenados . Ciencia estadística 24: 328–342.

Con respecto a los intervalos, puede valer la pena tener en cuenta que los intervalos de confianza frecuentas requieren / exigen una cobertura uniforme (exactamente o al menos mayor que x% para cada valor de parámetro que no tiene probabilidad cero) y si no lo hacen tener eso, no son realmente intervalos de confianza. (Algunos irían más allá y dirían que también deben descartar subconjuntos relevantes que cambien la cobertura).

La cobertura bayesiana generalmente se define relajándola a "cobertura promedio" dado que los supuestos anteriores resultan ser exactamente correctos. Gustafson y Groenlandia (2009) llaman a estos antecedentes omnipotentes y consideran los falibles para proporcionar una mejor evaluación.

— phaneron
fuente

1

+1 Nunca supe de esta diferencia en la restricción, gracias por señalarlo.

— Mehrdad

3

Si alguien hiciera una pregunta que tuviera una respuesta frecuente y bayesiana, sospecho que alguien más podría identificar una ambigüedad en la pregunta, por lo que no está "bien formada".

En otras palabras, si necesita una respuesta frecuentista, use métodos frecuentas. Si necesita una respuesta bayesiana, use métodos bayesianos. Si no sabe cuál necesita, es posible que no haya definido la pregunta sin ambigüedades.

Sin embargo, en el mundo real a menudo hay varias formas diferentes de definir un problema o hacer una pregunta. A veces no está claro cuál de esas formas es preferible. Esto es especialmente común cuando el cliente es estadísticamente ingenuo. Otras veces, una pregunta es mucho más difícil de responder que otra. En esos casos, a menudo se hace lo más fácil al tratar de asegurarse de que sus clientes estén de acuerdo con exactamente qué pregunta está haciendo o qué problema está resolviendo.

— Emil Friedman
fuente

3

Recomiendo mirar el ejercicio 3.15 de los algoritmos de información, inferencia y aprendizaje de libros de texto de libre acceso de MacKay.

Cuando se giró 250 veces, una moneda belga de un euro salió cara a cara 140 veces y cruzó 110. "Me parece muy sospechoso", dijo Barry Blight, profesor de estadística en la London School of Economics. "Si la moneda fuera imparcial, la posibilidad de obtener un resultado tan extremo como ese sería inferior al 7%". ¿Pero estos datos dan evidencia de que la moneda está sesgada en lugar de ser justa?

$p$ $0.07$ $6:1$

— Flounderer
fuente