Tengo un gran problema con un problema conceptual que se me ocurrió.
Digamos que una empresa tiene una distribución que está muy sesgada. Algo similar a un exponencial o lognormal solo más extremo. Ahora imagine que la distribución está tan sesgada que la media de la distribución es mayor que el percentil del 99% de la distribución. (Aka 1-2 valores extremadamente altos causaron que la media fuera extremadamente alta en comparación con el resto de la distribución).
Por definición, si esta distribución se usara para pronosticar un valor futuro (también conocido como una muestra aleatoria de la distribución), ¿sería cierto que la media no estaría en el intervalo de predicción del 95%?
En mi cerebro, un intervalo de predición del 95% es un rango en el que se ubicará el 95% de todos los valores futuros. Para cualquier distribución, esto debería ser exactamente igual al percentil .025 en el límite inferior y al percentil .975 en el límite superior ... Si la media es mayor que el percentil .975, entonces la media no estaría dentro del '95% intervalo de predicción ".
¿Estoy pensando en esto incorrectamente? Parece extraño informar un pronóstico como
- Valor medio previsto: 6,000,0000
- Intervalo de predicción del 95%: [400,5000].