Estoy usando Lasso para la selección de características en una configuración dimensional relativamente baja (n >> p). Después de ajustar un modelo de lazo, quiero usar las covariables con coeficientes distintos de cero para ajustar un modelo sin penalización. Estoy haciendo esto porque quiero estimaciones imparciales que Lasso no puede darme. También me gustaría valores p e intervalos de confianza para la estimación imparcial.
Tengo problemas para encontrar literatura sobre este tema. La mayor parte de la literatura que encuentro trata sobre poner intervalos de confianza en las estimaciones de Lasso, no un modelo reajustado.
Por lo que he leído, simplemente reajustar un modelo usando todo el conjunto de datos conduce a valores p / valores estándar poco realistas. En este momento, la división de muestras (al estilo de Wasserman y Roeder (2014) o Meinshausen et al. (2009)) parece ser un buen curso de acción, pero estoy buscando más sugerencias.
¿Alguien ha encontrado este problema? Si es así, ¿podría darnos algunas sugerencias?