Los modelos penalizados se pueden usar para estimar modelos donde el número de parámetros es igual o incluso mayor que el tamaño de la muestra. Esta situación puede surgir en modelos log-lineales de grandes tablas dispersas de datos categóricos o de conteo. En estos entornos, a menudo también es deseable o útil colapsar las tablas combinando niveles de un factor donde esos niveles no son distinguibles en términos de cómo interactúan con otros factores. Dos preguntas:
- ¿Hay alguna manera de usar modelos penalizados como LASSO o red elástica para probar la colapsabilidad de los niveles dentro de cada factor?
- Si la respuesta a la primera pregunta es sí, ¿puede y debe configurarse de tal manera que el colapso de los niveles y la estimación de los coeficientes del modelo ocurran en un solo paso?