Interpretación de la salida .L y .Q de un GLM binomial negativo con datos categóricos


14

Acabo de ejecutar un GLM binomial negativo y esta es la salida:

Call:
glm.nb(formula = small ~ method + site + depth, data = size.dat, 
    init.theta = 1.080668549, link = log)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.2452  -0.9973  -0.3028   0.3864   1.8727  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)   1.6954     0.1152  14.720  < 2e-16 ***
method.L     -0.6828     0.1637  -4.171 3.04e-05 ***
site.L        0.9952     0.2050   4.854 1.21e-06 ***
site.Q       -0.4634     0.1941  -2.387    0.017 *  
depth.L       0.8951     0.1988   4.502 6.74e-06 ***
depth.Q       0.2060     0.1984   1.038    0.299    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Negative Binomial(1.0807) family taken to be 1)

    Null deviance: 185.1  on 89  degrees of freedom
Residual deviance: 100.8  on 84  degrees of freedom
AIC: 518.24

Mis predictores son todos categóricos. Es por eso que estoy obteniendo .Ly .Q. Supongo que representan las diferentes categorías, pero ¿alguien sabe un código que pueda usar para etiquetarlas antes de ejecutar el GLM para que aparezcan como las diferentes categorías?



Encuentro que el código es bastante confuso ¿hay un código más simple? Las categorías son muy simples: método 1 y método 2, sitio 1, sitio 2 y sitio 3 y la profundidad es 5, 10 y 15
Vivienne

Respuestas:


12

Sus variables no solo están codificadas como factores (para hacerlas categóricas), están codificadas como factores ordenados . Luego, por defecto, R ajusta una serie de funciones polinómicas a los niveles de la variable. El primero es lineal ( .L), el segundo es cuadrático ( .Q), el tercero (si tuviera suficientes niveles) sería cúbico, etc. R se ajustará a una función polinómica menos que el número de niveles en su variable. Por ejemplo, si tiene solo dos niveles, solo se ajustaría la tendencia lineal. Además, las bases polinómicas utilizadas son ortogonales. (Por lo que vale, nada de esto es específico para R, o para modelos binomiales negativos, todo el software y los tipos de modelos de regresión harían lo mismo).


Centrándose específicamente en R, si quería las variables que han de codificarse como ordenada o desordenada, se utiliza el factor? :

my.variable <- factor(my.variable, ordered=TRUE)   # an ordered factor
my.variable <- factor(my.variable, ordered=FALSE)  # an unordered factor

Oh, los había ordenado ahora que tiene las etiquetas, ¡muchas gracias gung!
Vivienne
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.