Tenía un par de preguntas sobre la interpretación de las razones de probabilidades para las variables continuas en la regresión logística. Siento que estas son preguntas básicas sobre la regresión logística (y probablemente sobre la regresión en general), y aunque me da un poco de vergüenza no saber las respuestas, me tragaré mi orgullo y las preguntaré para saberlas en ¡el futuro!
Aquí está mi situación ... Estoy viendo una muestra de jóvenes adjudicados que, como parte de su libertad condicional, se inscribieron en un programa de capacitación laboral / habilidades para la vida. Quería ver hasta qué punto la edad a la que fueron liberados del programa predijo el empleo seis meses después del lanzamiento del programa.
(Además, tenga en cuenta que hay otros predictores en el modelo, pero los he excluido porque no son estadísticamente significativos y quiero mantener esto lo más claro posible).
Predictor: Edad de liberación del programa de entrenamiento (Edad media = 17.4, SD = 1.2, Rango 14.3-20.5)
Resultado: Empleado o no (Empleado = 1, No empleado = 0)
Resultado: Odds ratio 3.01 (p <.005) (he excluido las estadísticas de bondad de ajuste, etc. porque solo estoy buscando respuestas sobre la interpretación de la odds ratio; me siento cómodo con la evaluación del ajuste del modelo, IC) , etc.)
Dicho en palabras: a medida que la edad aumenta en un año, las probabilidades de estar empleado seis meses después del alta aumentan en tres unidades.
Preguntas:
1) Cuando digo: "A medida que la edad aumenta en un año ...", ¿cuál es el punto de partida para la edad?
¿La edad comienza en cero? Por ejemplo, "A medida que la edad aumenta de 0 [es decir, la edad más baja si tuviera que colocar este modelo en un gráfico] ..."
¿La edad comienza en la edad más baja entre el rango de edades de la muestra? Por ejemplo, "A medida que la edad aumenta de 14.3 ..."
O
¿La edad comienza en la edad media de la muestra? Por ejemplo, "A medida que la edad aumenta de 17.4 ...",
2) ¿El centrado me ayudaría a interpretar este resultado O es solo efectivo para interpretar el y-int? Si eso ayudara, estaba pensando en centrar o restar la edad más baja en el rango de todas las otras edades en la muestra. ¿Alguna sugerencia?
3) Finalmente, ¿es apropiado decir que en comparación con un joven de 14 años, un joven de 17 años tiene nueve veces más probabilidades de ser empleado? Pregunto porque sé que la regresión logística supone una relación sigmoidal, y tengo curiosidad por saber si este aumento de 3 unidades en las probabilidades se mantiene constante en cualquier punto a lo largo de la línea de regresión.
¡Muchas gracias!
Aaron