El término estadístico desviación se arroja demasiado. La mayoría de las veces, los programas devuelven la desviación
donde es su parámetro (s) estimado (s) a partir del ajuste del modelo es una ocurrencia potencialmente observada / observable de la cantidad aleatoria en cuestión.D ( y) = - 2 log{ p ( yEl |θ^) } ,
θ^y
La desviación más común a la que se refiere trataría la desviación anterior en función de dos variables, tanto los datos como los parámetros ajustados:
y, por lo tanto, si tuviera un valor pero dos valores de parámetros ajustados, y , entonces obtendría la desviación que mencionó de
Puede leer sobre la función de Matlab que mencionó , vinculada aquí . Aquí se vincula una discusión más fructífera, aunque más corta, sobre la desviación .D ( y,θ^) = - 2 log{ p ( yEl |θ^) }
yθ^1θ^2−2(log{p(y|θ^1)}−log{p(y|θ^2)}).
glmfit()
La estadística de desviación implícitamente supone dos modelos: el primero es su modelo ajustado, devuelto por glmfit()
, llame a este parámetro vector . El segundo es el "modelo completo" (también llamado "modelo saturado"), que es un modelo en el que hay una variable libre para cada punto de datos, llame a este parámetro vector . Obviamente, tener tantas variables libres es algo estúpido, pero le permite ajustarse exactamente a esos datos.θ^1θ^s
Entonces, las estadísticas de desviación se calculan como la diferencia entre la probabilidad de registro calculada en el modelo ajustado y el modelo saturado. Sea la colección de los N puntos de datos. Entonces:Y={y1,y2,⋯,yN}
DEV(θ^1,Y)=−2[logp(Y|θ^1)−logp(Y|θ^s)].
Los términos anteriores se ampliarán en sumas sobre los puntos de datos individuales por el supuesto de independencia. Si desea usar este cálculo para calcular la probabilidad logarítmica del modelo, primero deberá calcular la probabilidad logarítmica del modelo saturado. Aquí hay un enlace que explica algunas ideas para calcular esto ... pero el problema es que, en cualquier caso, tendrá que escribir una función que calcule la probabilidad de registro para su tipo de datos, y en ese caso Probablemente sea mejor crear su propia función que calcule la probabilidad de registro usted mismo, en lugar de retroceder a partir de un cálculo de desviación.yi
Consulte el Capítulo 6 del Análisis de datos bayesianos para una buena discusión sobre la desviación.
En cuanto a su segundo punto sobre la estadística de prueba de probabilidad, sí, parece que básicamente sabe lo que hay que hacer. Pero en muchos casos, considerará que la hipótesis nula es algo que el conocimiento externo experto le permite adivinar con anticipación (como si algún coeficiente fuera igual a cero). No es necesariamente algo que surge como resultado del ajuste del modelo.