Estoy tratando de hacer pruebas A / B de la manera bayesiano, como en Probabilístico de programación para los hackers y bayesiano A / B pruebas . Ambos artículos suponen que el tomador de decisiones decide cuál de las variantes es mejor basándose únicamente en la probabilidad de algún criterio, por ejemplo, , por lo tanto, es mejor. Esta probabilidad no proporciona ninguna información sobre si había suficiente cantidad de datos para sacar conclusiones de ella. Entonces, no está claro para mí cuándo detener la prueba.A
Supongamos que hay dos casas rodantes binarios, y , y yo quiero para estimar qué tan probable es que , y basado en las observaciones de y . Además, suponga que los posteriores y están distribuidos en beta.B p A > p B p A - p BABpApB
Como puedo encontrar los parámetros para y , puedo muestrear los posteriores y estimar . Ejemplo en python:p Ap BP ( p A > p B | datos )
import numpy as np
samples = {'A': np.random.beta(alpha1, beta1, 1000),
'B': np.random.beta(alpha2, beta2, 1000)}
p = np.mean(samples['A'] > samples['B'])
Podría obtener, por ejemplo, . Ahora me gustaría tener algo como .P ( p A > p B | datos ) = 0.95 ± 0.03
He investigado acerca de intervalos creíbles y factores de Bayes, pero no puedo entender cómo calcularlos para este caso si son aplicables. ¿Cómo puedo calcular estas estadísticas adicionales para tener un buen criterio de finalización?