Tienes razón en ambos aspectos. Vea la página de Frank Harrell aquí para obtener una larga lista de problemas con el binning de variables continuas. Si usa algunos contenedores, tira mucha información en los predictores; Si usa muchos, tiende a adaptarse a lo que debería ser una relación suave, si no lineal, y consume muchos grados de libertad. En general, es mejor usar polinomios ( ) o splines (polinomios por partes que se unen suavemente) para los predictores. Binning es realmente una buena idea cuando esperas una discontinuidad en la respuesta en los puntos de corte, digamos la temperatura a la que hierve algo o la edad legal para conducir, y cuando la respuesta es plana entre ellos.x+x2+…
¿El valor? Bueno, es una forma rápida y fácil de tener en cuenta la curvatura sin tener que pensar en ello, y el modelo puede ser lo suficientemente bueno para lo que está usando. Tiende a funcionar bien cuando tienes muchos datos en comparación con el número de predictores, cada predictor se divide en muchas categorías; en este caso dentro de cada banda de predicción, el rango de respuesta es pequeño y la respuesta promedio se determina con precisión.
[Editar en respuesta a los comentarios:
A veces hay límites estándar utilizados dentro de un campo para una variable continua: por ejemplo, en medicina, las mediciones de la presión arterial pueden clasificarse en baja, media o alta. Puede haber muchas buenas razones para usar tales límites cuando presente o aplique un modelo. En particular, las reglas de decisión a menudo se basan en menos información de la que se incluye en un modelo y es posible que sea simple de aplicar. Pero no se deduce que estos puntos de corte sean apropiados para agrupar los predictores cuando se ajusta al modelo.
Supongamos que alguna respuesta varía continuamente con la presión arterial. Si define un grupo de presión arterial alta como predictor en su estudio, el efecto que está estimando es la respuesta promedio sobre las presiones sanguíneas particulares de los individuos en ese grupo. Es nouna estimación de la respuesta promedio de las personas con presión arterial alta en la población general, o de las personas en el grupo de presión arterial alta en otro estudio, a menos que tome medidas específicas para que así sea. Si se conoce la distribución de la presión arterial en la población general, como imagino, será mejor calcular la respuesta promedio de las personas con presión arterial alta en la población general según las predicciones del modelo con la presión arterial como variable continua. El binning crudo hace que su modelo solo sea aproximadamente generalizable.
En general, si tiene preguntas sobre el comportamiento de la respuesta entre los puntos de corte, ajuste primero el mejor modelo que pueda y luego úselo para responderlas.]
[Con respecto a la presentación; Creo que este es un arenque rojo:
(1) La facilidad de presentación no justifica malas decisiones de modelado. (Y en los casos en que binning es una buena decisión de modelado, no necesita justificación adicional). Seguramente esto es evidente. Nadie recomienda nunca sacar una interacción importante de un modelo porque es difícil de presentar.
(2) Cualquiera sea el tipo de modelo que se ajuste, aún puede presentar sus resultados en términos de categorías si cree que ayudará a la interpretación. Aunque ...
(3) Debe tener cuidado para asegurarse de que no ayuda a la mala interpretación, por las razones expuestas anteriormente.
(4) De hecho, no es difícil presentar respuestas no lineales. La opinión personal, claramente, y el público difieren; pero nunca he visto un gráfico de valores de respuesta ajustados versus valores predictores que desconciertan a alguien solo porque es curvo. Interacciones, logits, efectos aleatorios, multicolinealidad, ... estos son mucho más difíciles de explicar.]
[Un punto adicional presentado por @Roland es la exactitud de la medición de los predictores; él sugiere, creo, que la categorización puede ser apropiada cuando no son especialmente precisos. El sentido común podría sugerir que no se mejoran las cosas volviendo a plantearlas con menos precisión, y el sentido común sería correcto: MacCallum et al (2002), "Sobre la práctica de la dicotomización de variables cuantitativas", Métodos psicológicos , 7 , 1, pp17-19.]