Las matemáticas de calcular la confianza y las bandas de predicción de curvas ajustadas por regresión no lineal se explican en esta página de validación cruzada. Muestra que las bandas no son siempre / generalmente simétricas.
Y aquí hay una explicación con más palabras y menos matemáticas:
Primero, definamos G | x, que es el gradiente de los parámetros en un valor particular de X y utilizando todos los valores de mejor ajuste de los parámetros. El resultado es un vector, con un elemento por parámetro. Para cada parámetro, se define como dY / dP, donde Y es el valor Y de la curva dado el valor particular de X y todos los valores de los parámetros de mejor ajuste, y P es uno de los parámetros).
G '| x es ese vector de gradiente transpuesto, por lo que es una columna en lugar de una fila de valores. Cov es la matriz de covarianza (Hessian inversa de la última iteración). Es una matriz cuadrada con el número de filas y columnas igual al número de parámetros. Cada elemento en la matriz es la covarianza entre dos parámetros. Usamos Cov para referirnos a la matriz de covarianza normalizada , donde cada valor está entre -1 y 1.
Ahora calcular
c = G '| x * Cov * G | x.
El resultado es un número único para cualquier valor de X.
Las bandas de confianza y predicción se centran en la curva de mejor ajuste, y se extienden por encima y por debajo de la curva en una cantidad igual.
Las bandas de confianza se extienden por encima y por debajo de la curva al:
= sqrt (c) * sqrt (SS / DF) * CríticoT (% de confianza, DF)
Las bandas de predicción se extienden una distancia adicional por encima y por debajo de la curva, igual a:
= sqrt (c + 1) * sqrt (SS / DF) * Crítico T (% de confianza, DF)
En ambas ecuaciones, el valor de c (definido anteriormente) depende del valor de X, por lo que las bandas de confianza y predicción no están a una distancia constante de la curva. El valor de SS es la suma de cuadrados para el ajuste, y DF es el número de grados de libertad (número de puntos de datos menos número de parámetros). CriticalT es una constante de la distribución t basada en el nivel de confianza que desea (tradicionalmente 95%) y el número de grados de libertad. Para límites del 95%, y un df bastante grande, este valor es cercano a 1.96. Si DF es pequeño, este valor es mayor.