En uno de los ejercicios de mi curso, estamos utilizando un conjunto de datos médicos de Kaggle .
El ejercicio dice:
queremos modelar la distribución de cargos individuales y también queremos capturar nuestra incertidumbre sobre esa distribución para poder capturar mejor el rango de valores que podríamos ver. Cargando los datos y realizando una vista inicial:
Podemos sospechar de lo anterior que hay algún tipo de distribución exponencial en juego aquí. ... Los cargos de reclamo de seguro pueden ser multimodales. La distribución gamma puede ser aplicable y podríamos probar esto para la distribución de cargos que no fueron reclamos de seguros primero.
Yo levanté la "distribución Gamma" y encontró "una, sólo positivo, distribución unimodal continuo que codifica el tiempo necesario para«alfa»los acontecimientos que se produzcan en un proceso de Poisson con la hora de llegada media de«beta»"
No hay tiempo involucrado aquí, solo cargos no relacionados, asegurados o no.
¿Por qué elegirían una distribución gamma?