¿Igual o diferente? El camino bayesiano


10

Digamos que tengo el siguiente modelo:

Poisson(λ){λ1if t<τλ2if tτ

Y deduzco los datos posteriores para y muestran a continuación a partir de mis datos. ¿Hay alguna forma bayesiana de decir (o cuantificar) si y son iguales o diferentes ?λ 2 λ 1 λ 2λ1λ2λ1λ2

¿Quizás medir la probabilidad de que sea ​​diferente deλ 2λ1λ2 ? ¿O tal vez usando divergencias KL?

Por ejemplo, ¿cómo puedo medir , o al menos, ?p ( λ 2 > λ 1 )p(λ2λ1)p(λ2>λ1)

En general, una vez que tenga las partes posteriores que se muestran a continuación (suponga valores PDF distintos de cero en todas partes para ambos), ¿cuál es una buena manera de responder esta pregunta?

ingrese la descripción de la imagen aquí

Actualizar

Parece que esta pregunta se puede responder de dos maneras:

  1. Si tenemos muestras de los posteriores, podríamos mirar la fracción de las muestras donde (o equivalente ). @ Cam.Davidson.Pilon incluyó una respuesta que abordaría este problema utilizando tales muestras.λ 2 > λ 1λ1λ2λ2>λ1

  2. Integrando algún tipo de diferencia de las posteriores. Y esa es una parte importante de mi pregunta. ¿Cómo sería esa integración? Presumiblemente, el enfoque de muestreo se aproximaría a esta integral, pero me gustaría saber la formulación de esta integral.

Nota: Las parcelas anteriores provienen de este material .


Puede calcular la varianza de ambas distribuciones y agregarlas. Esa es la varianza de la diferencia en las medias. Luego calcule la diferencia en las medias y vea cuántas desviaciones estándar es. Puede aproximar ambas distribuciones con normal para comenzar y utilizar los intervalos de confianza habituales para una distribución normal. Son medios claramente diferentes.
Dave31415


3
Todos los cálculos requeridos se proporcionan en mi trabajo, pero no he estudiado el caso de ( ϕ es la relación de las dos tasas de Poisson)H0:{ϕ=1}ϕ
Stéphane Laurent

Gracias @ StéphaneLaurent. Su artículo es un gran indicador, pero parece ser específico para los procesos de Poisson. ¿Cuál es la comparación, en un nivel alto, que un Bayesiano puede hacer para estimar si es igual o diferente de λ 1 ? ¿El análisis tiene que ser específico de distribución? λ2λ1
Amelio Vazquez-Reina

2
Lo siento @ user023472 No tengo energía en estos días. Ver los documentos de Bernardo citados en mi artículo. "Intrínseco" significa que el método se deriva y solo del modelo.
Stéphane Laurent

Respuestas:


6

Creo que una mejor pregunta es, ¿ son significativamente diferentes?

Para responder a esto, necesitamos calcular . Llamar a esta cantidad p . Si p 0.50 , entonces hay la misma posibilidad de que uno sea más grande que el otro. Por otro lado, si p está realmente cerca de 1, entonces podemos estar seguros de que λ 2 es más grande (léase: diferente) que λ 1 .P(λ2>λ1)pp0.50pλ2λ1

¿Cómo calculamos ? Es trivial en un marco Bayesian MCMC. Tenemos muestras de la parte posterior, así que simplemente calculemos el número de veces que las muestras de λ 2 son más grandes que λ 1 :pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Pido disculpas por no incluir esto en el libro, definitivamente lo agregaré, ya que creo que es una de las ideas más útiles en la inferencia bayesiana


55
La probabilidad es 1.0 son diferentes, ya que ambas son variables aleatorias continuas. Considere: ¿cuál es su suposición previa de que ? ¿De verdad crees que son realmente iguales? (Ignore las pruebas de hipótesis: estamos viviendo en el mundo real donde las variables nunca son realmente iguales). Ver esta publicación de mi héroe, Gelman. Computacionalmente, puedes probar esto computando . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon

1
P(|λ1λ2|>1)P(λ1λ2)

3
λ1λ2λ2λ1

1
¡Dios mío, odiaría estar en esa situación! Implica integrales desagradables. Para la mayoría de los modelos, no puede derivar los posteriores. Incluso si pudiera, podría ser mejor usar una computadora, solo por obtener muestras. En resumen, muestras> fórmulas para cálculos como este.
Cam.Davidson.Pilon

2
No estás midiendo "suficientemente grande". Considere una distribución con un pico en cero y otra con masas iguales en los picos -10, 10. Su estadística, el valor esperado del indicador de que una muestra es más grande que la otra, da 0.5, pero las distribuciones son claramente totalmente diferentes.
Neil G

5

λ1λ2Pr(λ1=λ2)=0

Sospecho que está interesado en la probabilidad de que y estén dentro de algún uno del otro. En ese caso, el área de la diferencia en las dos densidades posteriores en el intervalo es su respuesta. Los valores más grandes de superposición indican que los dos posteriores son más similares.λ 2 ϵ [ - ϵ / 2 , ϵ / 2 ]λ1λ2ϵ[ϵ/2,ϵ/2]

Si prefiere trabajar con resultados simulados (y para la mayoría de los problemas, no tenemos el lujo de elegir), simplemente tome la proporción de los resultados donde como una aproximación.λ2>λ1


Gracias. ¿Cómo se relaciona su respuesta con algunas de las ideas discutidas en los comentarios del OP?
Amelio Vazquez-Reina

Disculpas, pero no estoy familiarizado con ninguno de esos métodos, así que no puedo comentar significativamente. Sin embargo, @ Stéphane_Laurent es bastante inteligente, por lo que recomiendo mirar a través del enlace, como mínimo.
Sycorax dice Reinstate Monica

1
@ user023472 Lo siento, no tengo la energía para responder hoy sobre el enfoque de discrepancia intrínseca. Se basa en la divergencia Kullback-Leibler.
Stéphane Laurent

@ user777 Esto requiere reparación . ¿Qué si solo quiero ver la probabilidad o ? p ( λ 2 > λ 1 ) p ( λ 2λ 1 )ϵp(λ2>λ1)p(λ2λ1)
Amelio Vazquez-Reina

Gracias @ user777. Estoy interesado en el caso cuando no tenemos acceso a las muestras. Tuviste una integral en tu publicación anterior, pero parece que la has eliminado. ¿Cómo sería esa integral?
Amelio Vazquez-Reina
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.