Soy relativamente nuevo en R, y estoy tratando de ajustar un modelo a los datos que consisten en una columna categórica y una columna numérica (entera). La variable dependiente es un número continuo.
Los datos tienen el siguiente formato:
predCateg, predIntNum, ResponseVar
Los datos se parecen a esto:
ranking, age_in_years, wealth_indicator
category_A, 99, 1234.56
category_A, 21, 12.34
category_A, 42, 234.56
....
category_N, 105, 77.27
¿Cómo modelaría esto (presumiblemente, usando un GLM), en R?
[[Editar]]
Se me acaba de ocurrir (después de analizar los datos más a fondo) que la variable independiente categórica está de hecho ordenada. Por lo tanto, he modificado la respuesta proporcionada anteriormente de la siguiente manera:
> fit2 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years, data=amort2)
>
> fit2
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years,
data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q ordered(ranking).C age_in_years
0.0578500 -0.0055454 -0.0013000 0.0007603 0.0036818
Degrees of Freedom: 39 Total (i.e. Null); 35 Residual
Null Deviance: 0.004924
Residual Deviance: 0.00012 AIC: -383.2
>
> fit3 <- glm(wealth_indicator ~ ordered(ranking) + age_in_years + ordered(ranking)*age_in_years, data=amort2)
> fit3
Call: glm(formula = wealth_indicator ~ ordered(ranking) + age_in_years +
ordered(ranking) * age_in_years, data = amort2)
Coefficients:
(Intercept) ordered(ranking).L ordered(ranking).Q
0.0578500 -0.0018932 -0.0039667
ordered(ranking).C age_in_years ordered(ranking).L:age_in_years
0.0021019 0.0036818 -0.0006640
ordered(ranking).Q:age_in_years ordered(ranking).C:age_in_years
0.0004848 -0.0002439
Degrees of Freedom: 39 Total (i.e. Null); 32 Residual
Null Deviance: 0.004924
Residual Deviance: 5.931e-05 AIC: -405.4
Estoy un poco confundido por lo que ordered(ranking).C
, ordered(ranking).Q
y ordered(ranking).L
media en la salida, y agradecería un poco de ayuda en la comprensión de esta salida, y cómo lo uso para predecir la variable de respuesta.
factor(ranking)
noas.factor(ranking)
?