Suponga que es un conjunto de resultados mutuamente excluyentes de una variable aleatoria discreta es una función de utilidad donde , , etc.
Cuando se distribuye uniformemente sobre y es una función de masa de probabilidad , la entropía de Shannon se maximiza (, y cuando un elemento entiene todala masade, la entropía de Shannon se minimiza (, de hecho). Esto corresponde a intuiciones sobresorpresa(oreducción de la incertidumbre) y resultados eincertidumbre(osorpresa esperada) y variables aleatorias:
- Cuando se distribuye uniformemente, la incertidumbre se maximiza, y cuantos más resultados haya para que la masa se distribuya uniformemente, más inciertos somos.
- Cuando tiene toda su masa concentrada en un resultado, no tenemos incertidumbre.
- Cuando asignamos a un resultado una probabilidad de , no obtenemos información ("no nos sorprende") cuando realmente la observamos.
- Cuando asignamos a un resultado una probabilidad cada vez más cercana a , la observación de que realmente ocurre se vuelve más y más informativa ("sorprendente").
(Todo esto no dice nada sobre la interpretación de codificación mucho más concreta, pero menos epistémica, de la información / entropía de Shannon, por supuesto).
Sin embargo, cuando tiene la interpretación de una función de utilidad , ¿hay una interpretación sensorial de o∑f(ω)log1 ? Me parece que puede haber:
- si como PMF representa una distribución uniforme sobre Ω , entonces f como función de utilidad corresponde a la indiferencia sobre los resultados que no podrían ser mayores *
- una función de utilidad en la que un resultado tiene toda la utilidad y el resto no tiene ninguna (tan sesgada de una utilidad como podría existir) corresponde a preferencias relativas muy fuertes : una falta de indiferencia.
¿Hay alguna referencia que se expanda sobre esto? ¿Me he perdido algo acerca de las limitaciones en la comparación de funciones de masa de probabilidad y utilidades relativas normalizadas sobre variables aleatorias discretas?
* Soy consciente de las curvas de indiferencia y no veo cómo podrían ser relevantes para mi pregunta por una variedad de razones, comenzando con mi enfoque en un espacio muestral categórico y con el hecho de que no estoy interesado en la 'indiferencia' per se, sino más bien cómo interpretar las utilidades como probabilidades y cómo interpretar los funcionales en las probabilidades cuando la 'distribución de probabilidad' (discreta) en cuestión en realidad o (adicionalmente) tiene la interpretación de una función de utilidad.