Cuando se discuten las tasas de logro de tareas, ¿hay alguna forma de demostrar que 0 de 20 intentos es "peor" que 0 de 10 intentos?
Cuando se discuten las tasas de logro de tareas, ¿hay alguna forma de demostrar que 0 de 20 intentos es "peor" que 0 de 10 intentos?
Respuestas:
Supongamos que sabemos la probabilidad de éxito en un intento. En este caso calculamos la probabilidad de 0 de 10 y 0 de 20 casos.
Sin embargo, en este caso vamos al revés. No sabemos la probabilidad, tenemos los datos e intentamos estimar la probabilidad.
Cuantos más casos tengamos, más seguros podemos estar con respecto a los resultados. Si lanzo una moneda y será cara, no estarás muy seguro de que es doble. Si lo lanzo 1,000 veces y serán todas las cabezas, es poco probable que esté equilibrado.
Hay métodos que fueron diseñados para considerar el número de senderos al dar las estimaciones. Uno de ellos es el suavizado aditivo del que @abukaj comenta más arriba. En el suavizado aditivo, agregamos pseudo muestras adicionales en consideración. En nuestro caso, en lugar del camino que hemos visto, agregamos dos más: uno exitoso y otro fallido.
Tenga en cuenta que el suavizado aditivo es solo un método de estimación. Obtendrá diferentes resultados con diferentes métodos. Incluso con el suavizado aditivo en sí mismo, habría obtenido resultados diferentes si hubiera agregado 4 pseudo muestras.
Otro método es usar el intervalo de confianza como sugirió @mdewey. Cuantas más muestras tengamos, más corto será el intervalo de confianza. El tamaño del intervalo de confianza es proporcional a la raíz cuadrada de las muestras: . Por lo tanto, duplicar el número de muestras conducirá a un intervalo de confianza más corto.
La media en ambos casos es 0. Tomamos un nivel de confianza del 90% (z = 1.645)
En caso de falta de datos, existe incertidumbre. Las suposiciones que haga y los datos externos que usará cambiarán lo que obtendrá.
Extendiendo la idea de invocar intervalos de confianza, existe el concepto de un intervalo binomial exacto.
El concepto del intervalo de confianza es vincular un conjunto de valores posibles de los parámetros del modelo (aquí, probabilidades de éxito ) para que podamos hacer declaraciones probabilísticas (bueno, frecuentas ) sobre si el valor del parámetro verdadero está dentro de este intervalo (es decir , que si repetimos el experimento probabilístico de hacer 10 o 20 ensayos, y construimos el intervalo de confianza de una manera específica, observaremos que el verdadero valor del parámetro está dentro del intervalo el 95% del tiempo).
En este caso, podemos resolver para en esa fórmula:
Entonces, si quisiéramos un intervalo unilateral del 95%, estableceríamos para resolver la probabilidad de que el conteo cero observado sea como máximo 5%. Para , la respuesta es (es decir, en el extremo, si la probabilidad de éxito en cada prueba es 13.9%, entonces la probabilidad de observar cero éxitos es 5%). Para , la respuesta es . Entonces, de una muestra de , aprendimos más que de la muestra de , en el sentido de que podemos `` excluir '' el rango que la muestra de Todavía se va como plausible.
La función de probabilidad es Bernoulli y la distribución Beta es un conjugado anterior para la distribución de Bernoulli, por lo tanto, la posterior sigue a la distribución Beta. Además, el posterior está parametrizado por:
Por consiguiente:
Por lo tanto, si ve 10 fallas, su expectativa de es , y si ve 20 fallas, su expectativa de es . Cuantos más fracasos vea, menor será su expectativa de .
¿Es este un argumento razonable? Depende de cómo se sienta acerca de las estadísticas bayesianas, si está dispuesto a modelar la incertidumbre sobre algún parámetro utilizando la mecánica de la probabilidad. Y depende de cuán razonable sea su elección de un prior.