Esta es una pregunta sobre una práctica o método seguido por algunos de mis colegas. Al hacer un modelo de regresión logística, he visto a personas reemplazar las variables categóricas (o variables continuas que están agrupadas) con su respectivo peso de evidencia (WoE). Se supone que esto se hace para establecer una relación monotónica entre el regresor y la variable dependiente. Ahora, por lo que entiendo, una vez que se hace el modelo, las variables en la ecuación NO son las variables en el conjunto de datos. ¡Más bien, las variables en la ecuación ahora son un poco la importancia o el peso de las variables en la segregación de la variable dependiente !
Mi pregunta es: ¿cómo interpretamos ahora el modelo o los coeficientes del modelo? Por ejemplo, para la siguiente ecuación:
podemos decir que es el aumento relativo en la proporción de impares para el aumento de 1 unidad en la variable .x 1
Pero si la variable se reemplaza por su WoE, entonces la interpretación se cambiará a: aumento relativo en la proporción de impares para un aumento de 1 unidad en la IMPORTANCIA / PESO de la variable
He visto esta práctica en internet, pero en ninguna parte encontré la respuesta a esta pregunta. Este enlace de esta comunidad está relacionado con una consulta algo similar en la que alguien escribió:
WoE muestra una relación lineal con el logaritmo natural de la razón de posibilidades, que es la variable dependiente en la regresión logística. Por lo tanto, la cuestión de la especificación errónea del modelo no surge en la regresión logística cuando usamos WoE en lugar de los valores reales de la variable.
Pero aún no entiendo la explicación. Por favor, ayúdame a entender lo que me falta.