La versión corta es que la distribución Beta puede entenderse como una distribución de probabilidades , es decir, representa todos los valores posibles de una probabilidad cuando no sabemos cuál es esa probabilidad. Aquí está mi explicación intuitiva favorita de esto:
Cualquiera que siga el béisbol está familiarizado con los promedios de bateo : simplemente la cantidad de veces que un jugador recibe un golpe base dividido por la cantidad de veces que sube al bate (por lo que es solo un porcentaje entre 0
y 1
). .266
en general se considera un promedio de bateo promedio, mientras que .300
se considera excelente.
Imagine que tenemos un jugador de béisbol y queremos predecir cuál será su promedio de bateo de toda la temporada. Se podría decir que podemos usar su promedio de bateo hasta ahora, ¡pero esta será una medida muy pobre al comienzo de una temporada! Si un jugador sube al bate una vez y obtiene un sencillo, su promedio de bateo es brevemente 1.000
, mientras que si se poncha, su promedio de bateo es 0.000
. No mejora mucho si subes a batear cinco o seis veces, podrías obtener una racha de suerte y obtener un promedio de 1.000
, o una racha de mala suerte y obtener un promedio de 0
, ninguno de los cuales es un predictor remotamente bueno de cómo Batearás esa temporada.
¿Por qué su promedio de bateo en los primeros golpes no es un buen indicador de su promedio de bateo eventual? Cuando el primer turno al bate de un jugador es un ponche, ¿por qué nadie predice que nunca recibirá un golpe en toda la temporada? Porque vamos con expectativas previas. Sabemos que en la historia, la mayoría de los promedios de bateo durante una temporada han oscilado entre algo así .215
como .360
, con algunas excepciones extremadamente raras en ambos lados. Sabemos que si un jugador obtiene algunos ponches seguidos al inicio, eso podría indicar que terminará un poco peor que el promedio, pero sabemos que probablemente no se desviará de ese rango.
Dado nuestro problema de promedio de bateo, que puede representarse con una distribución binomial (una serie de éxitos y fracasos), la mejor manera de representar estas expectativas previas (lo que en estadística llamamos un prior ) es con la distribución Beta: es decir, antes de ver al jugador dar su primer golpe, lo que más o menos esperamos sea su promedio de bateo. El dominio de la distribución Beta es (0, 1)
, como una probabilidad, por lo que ya sabemos que estamos en el camino correcto, pero la idoneidad de la Beta para esta tarea va mucho más allá de eso.
Esperamos que el promedio de bateo de toda la temporada del jugador sea más probable .27
, pero que podría variar razonablemente de .21
a .35
. Esto se puede representar con una distribución Beta con los parámetros y β = 219 :α = 81β= 219
curve(dbeta(x, 81, 219))
Se me ocurrieron estos parámetros por dos razones:
- La media es αα + β= 8181 + 219= .270
- Como puede ver en la trama, esta distribución se encuentra casi por completo dentro
(.2, .35)
del rango razonable para un promedio de bateo.
Usted preguntó qué representa el eje x en un diagrama de densidad de distribución beta, aquí representa su promedio de bateo. Por lo tanto, observe que en este caso, no solo el eje y es una probabilidad (o más precisamente una densidad de probabilidad), sino también el eje x (¡el promedio de bateo es solo la probabilidad de un golpe, después de todo)! La distribución Beta representa una distribución de probabilidad de probabilidades .
Pero he aquí por qué la distribución Beta es tan apropiada. Imagina que el jugador recibe un solo golpe. Su récord para la temporada es ahora 1 hit; 1 at bat
. Luego tenemos que actualizar nuestras probabilidades; queremos cambiar toda esta curva solo un poco para reflejar nuestra nueva información. Si bien las matemáticas para probar esto son un poco complicadas ( se muestra aquí ), el resultado es muy simple . La nueva distribución Beta será:
Beta ( α0 0+ golpes , β0 0+ fallas )
α0 0β0 0αβBeta (81+1,219)
curve(dbeta(x, 82, 219))
Tenga en cuenta que apenas ha cambiado, ¡el cambio es realmente invisible a simple vista! (Eso es porque un golpe realmente no significa nada).
Beta (81+100,219+200)
curve(dbeta(x, 81+100, 219+200))
Observe que la curva ahora es más delgada y desplazada hacia la derecha (mayor promedio de bateo) de lo que solía ser: tenemos una mejor idea de cuál es el promedio de bateo del jugador.
αα + β81 + 10081 + 100 + 219 + 200= .30381100100 + 200= .3338181+219=.270
Por lo tanto, la distribución Beta es mejor para representar una distribución probabilística de probabilidades , el caso en el que no sabemos cuál es la probabilidad de antemano, pero tenemos algunas conjeturas razonables.