No creo que el título de su pregunta capture con precisión lo que está pidiendo.
La cuestión de cómo interpretar los parámetros en un GLM es muy amplia porque el GLM es una clase muy amplia de modelos. Recuerde que un GLM modela una variable de respuesta que se supone que sigue una distribución conocida de la familia exponencial, y que hemos elegido una función invertible g tal que
E [ yysol
paralas variables predictoras J x . En este modelo, la interpretación de cualquier parámetro particular β j es la tasa de cambio de g ( y ) con respecto a x j . Definir μ ≡ E [ y
E [ yEl |x ] = g- 1( x0 0+ x1β1+ ⋯ + xJβJ)
JXβjsol(y)xj y
η≡x⋅βpara mantener limpia la notación. Entonces, para cualquier
j∈{1,...,J},
β j = ∂μ≡E[y|x]=g−1(x)η≡x⋅βj∈{1,…,J}
Ahora defina
ejcomo un vector deceros
J-1y un solo
1en laposición
j, de modo que, por ejemplo, si
J=5,entonces
e3=(0,0,1,0,0). Entonces
βj=g(E [ yβj=∂η∂xj=∂g(μ)∂xj.
ejJ−11jJ=5e3=(0,0,1,0,0)βj=g(E[y|x+ej])−g(E[y|x])
Lo que simplemente significa que es el efecto sobre η de un aumento unitario en x j .βjηxj
También puede establecer la relación de esta manera:
y
E[y
∂E[y|x]∂xj=∂μ∂xj=dμdη∂η∂xj=∂μ∂ηβj=dg−1dηβj
E[y|x+ej]−E[y|x]≡Δjy^=g−1((x+ej)β)−g−1(xβ)
Sin saber nada sobre , eso es lo más lejos que podemos llegar. β j es el efecto sobre η , en la media condicional transformada de y , de una unidad de aumento en x j , y el efecto sobre la media condicional de y de un aumento de una unidad en x j es g - 1 ( β ) .gβjηyxjyxjg−1(β)
Pero parece estar preguntando específicamente sobre la regresión de Poisson usando la función de enlace predeterminada de R, que en este caso es el logaritmo natural. Si ese es el caso, está preguntando acerca de un tipo específico de GLM en el que y g = ln . Entonces podemos obtener algo de tracción con respecto a una interpretación específica.y∼Poisson(λ)g=ln
Por lo que dije anteriormente, sabemos que ∂μ∂xj=dg−1dηβj. And since we know g(μ)=ln(μ), we also know that g−1(η)=eη. We also happen to know that deηdη=eη, so we can say that
∂μ∂xj=∂E[y|x]∂xj=ex0+x1β1+⋯+xJβJβj
which finally means something tangible:
Given a very small change in xj, the fitted y^ changes by y^βj.
Note: this approximation can actually work for changes as large as 0.2, depending on how much precision you need.
And using the more familiar unit change interpretation, we have:
Δjy^=ex0+x1β1+⋯+(xj+1)βj+⋯+xJβJ−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ+βj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJeβj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ(eβj−1)
which means
Given a unit change in xj, the fitted y^ changes by y^(eβj−1).
There are three important pieces to note here:
- The effect of a change in the predictors depends on the level of the response.
- An additive change in the predictors has a multiplicative effect on the response.
- You can't interpret the coefficients just by reading them (unless you can compute arbitrary exponentials in your head).
So in your example, the effect of increasing pH by 1 is to increase lny^ by y^(e0.09−1); that is, to multiply y^ by e0.09≈1.09. It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.