Mi situacion es:
Tengo 1 variable dependiente continua y 1 variable predictiva continua que he transformado logarítmicamente para normalizar sus residuos para una regresión lineal simple.
Agradecería cualquier ayuda sobre cómo puedo relacionar estas variables transformadas con su contexto original.
Quiero usar una regresión lineal para predecir el número de días que los alumnos faltaron a la escuela en 2011 en función del número de días que perdieron en 2010. La mayoría de los alumnos pierden 0 días o solo unos pocos días, los datos están sesgados positivamente a la izquierda. Por lo tanto, existe una necesidad de transformación para usar la regresión lineal.
Utilicé log10 (var + 1) para ambas variables (utilicé +1 para alumnos que habían perdido 0 días de escuela). Estoy usando la regresión porque quiero agregar factores categóricos: género / etnia, etc.
Mi problema es:
La audiencia a la que quiero retroalimentar no entendería log10 (y) = log (constante) + log (var2) x (y, francamente, yo tampoco).
Mis preguntas son:
a) ¿Hay mejores formas de interpretar las variables transformadas en la regresión? Es decir, por cada 1 día perdido en 2010, se perderán 2 días en 2011, en lugar de por 1 cambio de unidad de registro en 2010, ¿habrá x cambio de unidades de registro en 2011?
b) Específicamente, dado el pasaje citado de esta fuente de la siguiente manera:
"Esta es la estimación de regresión binomial negativa para un aumento de una unidad en el puntaje de la prueba estandarizada de matemáticas, dado que las otras variables se mantienen constantes en el modelo. Si un estudiante aumentara su puntaje de prueba de matemáticas en un punto, la diferencia en los registros de se espera que los recuentos esperados disminuyan en 0.0016 unidades, mientras se mantienen constantes las otras variables en el modelo ".
Me gustaría saber:
- ¿Este pasaje dice que por cada unidad de aumento en el puntaje de la
UNTRANSFORMED
variable matemática conduce a una disminución de 0.0016 de la constante (a), entonces si elUNTRANSFORMED
puntaje de matemática aumenta en dos puntos, resto 0.0016 * 2 de la constante a? - ¿Significa eso que obtengo la media geométrica usando exponencial (a)) y exponencial (a + beta * 2) y que necesito calcular la diferencia porcentual entre estos dos para decir qué efecto tiene la (s) variable (s) predictiva (s) / tener en la variable dependiente?
- ¿O me he equivocado totalmente?
Estoy usando SPSS v20. Perdón por enmarcar esto en una larga pregunta.
R
tiene paquetes para modelos con cero inflado; busque en este sitio .)