Probabilidad
Los problemas comunes en la teoría de probabilidad se refieren a la probabilidad de observaciones dado un cierto modelo y dados los parámetros (llamémoslos ) involucrados. Por ejemplo, las probabilidades para situaciones específicas en juegos de cartas o juegos de dados son a menudo muy sencillas.x1,x2,...,xnθ
Sin embargo, en muchas situaciones prácticas estamos tratando con una situación inversa ( estadística inferencial ). Es decir: se da la observación y ahora se desconoce el modelo , o al menos no conocemos ciertos parámetros .x1,x2,...,xkθ
En este tipo de problemas, a menudo nos referimos a un término llamado probabilidad de los parámetros, , que es una tasa de creencia en un parámetro específico dadas observaciones . Este término se expresa como proporcional a la probabilidad de las observaciones suponiendo que un parámetro modelo sería hipotéticamente verdadero. L(θ)θx1,x2,..xkx1,x2,..xkθ
L(θ,x1,x2,..xk)∝probability observations x1,x2,..xk given θ
Para un valor de parámetro dado más probable sea cierta observación (en relación con la probabilidad con otros valores de parámetro), más la observación apoya este parámetro particular (o teoría / hipótesis que asume este parámetro) . Una alta probabilidad (relativa) reforzará nuestras creencias sobre el valor de ese parámetro (hay mucho más filosófico que decir sobre esto).θx1,x2,..xn
Probabilidad en el problema del tanque alemán
Ahora, para el problema del tanque alemán, la función de probabilidad para un conjunto de muestras es:x1,x2,..xk
L(θ,x1,x2,..xk)=Pr(x1,x2,..xk,θ)={0(θk)−1if max(x1,x2,..xk)>θif max(x1,x2,..xk)≤θ,
Si observa las muestras {1, 2, 10} o las muestras {8, 9, 10} no debería importar cuándo se consideran las muestras desde una distribución uniforme con el parámetro . Ambas muestras son igualmente probables con probabilidad y usando la idea de probabilidad de que una muestra no diga más sobre el parámetro que la otra muestra.θ(θ3)−1θ
Los valores altos {8, 9, 10} pueden hacerle pensar / creer que debería ser más alto. Pero, es solo el valor {10} lo que realmente le brinda información relevante sobre la probabilidad de (el valor 10 le dice que será diez o superior, los otros valores 8 y 9 no contribuyen en nada a esta información )θθθ
Teorema de factorización de Fisher Neyman
Este teorema le dice que un cierto estadístico (es decir, alguna función de las observaciones, como la media, la mediana o, como en el problema del tanque alemán, el máximo) es suficiente (contiene toda la información) cuando puede factorizar, en la función de verosimilitud, los términos que dependen de las otras observaciones , de modo que este factor no dependa tanto del parámetro como de (y la parte de la función de verosimilitud que relaciona los datos con los valores de parámetros hipotéticos solo depende de la estadística pero no del conjunto de datos / observaciones).T(x1,x2,…,xk)x1,x2,…,xkθx1,x2,…,xk
El caso del problema del tanque alemán es simple. Puede ver arriba que toda la expresión para la Probabilidad anterior ya solo depende de la estadística y el resto de los valores no importa.max(x1,x2,..xk)x1,x2,..xk
Pequeño juego como ejemplo
Digamos que jugamos el siguiente juego repetidamente: es en sí misma una variable aleatoria y se dibuja con igual probabilidad ya sea 100 o 110. Luego sacamos una muestra .θx1,x2,...,xk
Queremos elegir una estrategia para adivinar , basada en los observados que maximiza nuestra probabilidad de tener la conjetura correcta de .θx1,x2,...,xkθ
La estrategia adecuada será elegir 100 a menos que uno de los números de la muestra sea> 100.
Podríamos sentir la tentación de elegir el valor del parámetro 110 cuando muchos de los tienden a ser valores altos cercanos a cien (pero ninguno exactamente superior a cien), pero eso sería incorrecto. La probabilidad de tal observación será mayor cuando el verdadero valor del parámetro sea 100 que cuando sea 110. Entonces, si suponemos, en tal situación, 100 como el valor del parámetro, entonces será menos probable que cometamos un error (porque el La situación con estos valores altos cercanos a cien, pero aún por debajo, ocurre con mayor frecuencia en el caso de que el valor verdadero sea 100 en lugar de que el valor verdadero sea 110).x1,x2,...,xk