Estoy llevando a cabo una regresión logística con un resultado binario (inicio y no inicio). Mi combinación de predictores son variables continuas o dicotómicas.
Usando el enfoque Box-Tidwell, uno de mis predictores continuos potencialmente viola la suposición de linealidad del logit. Las estadísticas de bondad de ajuste no indican que el ajuste sea problemático.
Posteriormente ejecuté el modelo de regresión nuevamente, sustituyendo la variable continua original con: en primer lugar, una transformación de raíz cuadrada y, en segundo lugar, una versión dicotómica de la variable.
Al inspeccionar el resultado, parece que la bondad de ajuste mejora marginalmente, pero los residuos se vuelven problemáticos. Las estimaciones de los parámetros, los errores estándar y siguen siendo relativamente similares. La interpretación de los datos no cambia en términos de mi hipótesis, en los 3 modelos.
Por lo tanto, en términos de utilidad de mis resultados y sentido de interpretación de los datos, parece apropiado informar el modelo de regresión utilizando la variable continua original.
Me pregunto esto:
- ¿Cuándo es robusta la regresión logística frente a la posible violación de la linealidad del supuesto logit?
- Dado mi ejemplo anterior, ¿parece aceptable incluir la variable continua original en el modelo?
- ¿Existen referencias o guías para recomendar cuando es satisfactorio aceptar que el modelo es robusto contra la posible violación de la linealidad del logit?