Tengo un par de preguntas para los intervalos de predicción y tolerancia.
Acordemos primero la definición de los intervalos de tolerancia: se nos da un nivel de confianza, digamos 90%, el porcentaje de la población a capturar, digamos 99%, y un tamaño de muestra, digamos 20. La distribución de probabilidad es conocida, digamos normal por conveniencia. Ahora, dados los tres números anteriores (90%, 99% y 20) y el hecho de que la distribución subyacente es normal, podemos calcular el número de tolerancia . Dada una muestra ( x 1 , x 2 , ... , x 20 ) con media ˉ x y la desviación estándar s , la tolerancia del intervalo es ˉ x ± k s. Si este intervalo de tolerancia captura al 99% de la población, entonces la muestra se llama un éxito y el requisito es que el 90% de las muestras sean exitosas .
Comentario: 90% es la probabilidad a priori de que una muestra sea un éxito. El 99% es la probabilidad condicional de que una observación futura estará en el intervalo de tolerancia, dado que la muestra es un éxito.
Mis preguntas: ¿Podemos ver los intervalos de predicción como intervalos de tolerancia? Mirando en la web obtuve respuestas contradictorias sobre esto, sin mencionar que nadie realmente definió los intervalos de predicción con cuidado. Entonces, si tiene una definición precisa del intervalo de predicción (o una referencia), se lo agradecería.
Lo que entendí es que un intervalo de predicción del 99%, por ejemplo, no captura el 99% de todos los valores futuros para todas las muestras. Esto sería lo mismo que un intervalo de tolerancia que captura al 99% de la población con un 100% de probabilidad.
En las definiciones que encontré para un intervalo de predicción del 90%, el 90% es la probabilidad a priori dada una muestra, digamos (el tamaño es fijo) y una sola observación futura y , que y estará en el intervalo de predicción. Entonces, parece que tanto la muestra como el valor futuro se dan al mismo tiempo, en contraste con el intervalo de tolerancia, donde se da la muestra y con una cierta probabilidad de que sea un éxito , y bajo la condición de que la muestra sea un exito, se da un valor futuro y con cierta probabilidad cae dentro del intervalo de tolerancia. No estoy seguro de si la definición anterior del intervalo de predicción es correcta o no, pero parece contradictorio (al menos).
¿Alguna ayuda?