Sé que esta pregunta es bastante ingenua y simple, pero no sé exactamente por qué la función canónica del enlace es tan útil
¿Es realmente tan útil? Una función de enlace que es canónica es principalmente una propiedad matemática. Simplifica un poco las matemáticas, pero en el modelado, de todos modos, debe usar la función de enlace que tiene significado científico.
Entonces, ¿qué propiedades adicionales tiene una función de enlace canónico?
Conduce a la existencia de suficientes estadísticas. Eso podría implicar una estimación algo más eficiente, tal vez, pero el software moderno (como glm
en R) no parece tratar los enlaces canónicos de manera diferente a otros enlaces.
Simplifica algunas fórmulas, por lo que se facilitan los desarrollos teóricos. Muchas buenas propiedades matemáticas, vea ¿Cuál es la diferencia entre una "función de enlace" y una "función de enlace canónico" para GLM ?
Entonces, las ventajas parecen ser principalmente matemáticas y algorítmicas, no realmente estadísticas.
Algunos detalles más: Let Y1,…,Yn ser observaciones independientes del modelo de familia de dispersión exponencial
fY(y;θ,ϕ)=exp{(yθ−b(θ))/a(ϕ)+c(y,ϕ)}
con expectativa EYi=μi y predictor lineal ηi=xTiβ con vector covariable xi. La función de enlace es canónica siηi=θi. En este caso, la función de probabilidad se puede escribir como
L(β;ϕ)=exp{∑iyixTiβ−b(xTiβ)a(ϕ)+∑ic(yi,ϕ)}
y por el teorema de factorización podemos concluir que∑ixiyi es suficiente para β.
Sin entrar en detalles, las ecuaciones necesarias para IRLS se simplificarán. Del mismo modo, esta búsqueda en Google parece encontrar principalmente enlaces canónicos mencionados en el contexto de las simplificaciones, y no más razones estadísticas.