Usando R, he ajustado un modelo lineal para una variable de respuesta única a partir de una combinación de predictores continuos y discretos. Esto es súper básico, pero tengo problemas para comprender cómo funciona un coeficiente para un factor discreto.
Concepto: Obviamente, el coeficiente de la variable continua 'x' se aplica en la forma, y = coefx(varx) + intercept
pero ¿cómo funciona eso para un factor z si el factor no es numérico?y = coefx(varx) + coefz(factorz???) + intercept
Específico: He ajustado un modelo en R como lm(log(c) ~ log(d) + h + a + f + h:a)
donde h
y f
son factores discretos, no numéricos. Los coeficientes son:
Coefficients:
Estimate
(Intercept) -0.679695
log(d) 1.791294
h1 0.870735
h2 -0.447570
h3 0.542033
a 0.037362
f1 -0.588362
f2 0.816825
f3 0.534440
h1:a -0.085658
h2:a -0.034970
h3:a -0.040637
¿Cómo los uso para crear la ecuación predictiva?
log(c) = 1.791294(log(d)) + 0.037362(a) + h??? + f???? + h:a???? + -0.679695
¿O lo estoy haciendo mal?
Creo que ese concepto es si el sujeto cae en categoría h1
y f2
la ecuación se convierte en:
log(c) = 1.791294(log(d)) + 0.037362(a) + 0.870735 + 0.816825 + h:a???? + -0.679695
Pero realmente no tengo claro cómo h:a
se analiza el término interactivo. Gracias por ser fácil conmigo.
g1