Digamos que estoy construyendo un modelo de regresión logística donde la variable dependiente es binaria y puede tomar los valores. o . Deje que las variables independientes sean - existen variables independientes. Digamos por elEn la variable independiente, el análisis bivariado muestra una tendencia en forma de U, es decir, si agrupo dentro cada uno de ellos contiene aproximadamente el mismo número de observaciones y calculo la 'tasa mala' para cada contenedor - # observaciones donde y = 0 / observaciones totales en cada contenedor - luego obtengo una curva en forma de U.
Mis preguntas son:
- ¿Puedo usar directamente como entrada al estimar los parámetros beta? ¿Se violan algunos supuestos estadísticos que podrían causar un error significativo en la estimación de los parámetros?
- ¿Es necesario 'linealizar' esta variable a través de una transformación (log, cuadrado, producto consigo mismo, etc.)?