Una de las motivaciones para la red elástica fue la siguiente limitación de LASSO:
En el caso , el lazo selecciona como máximo n variables antes de saturarse, debido a la naturaleza del problema de optimización convexa. Esto parece ser una característica limitante para un método de selección variable. Además, el lazo no está bien definido a menos que el límite en la norma L1 de los coeficientes sea menor que un cierto valor.
( http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9868.2005.00503.x/full )
Entiendo que LASSO es un problema de programación cuadrática, pero también se puede resolver a través de LARS o el descenso de gradiente por elementos. Pero no entiendo dónde en estos algoritmos encuentro un problema si donde es el número de predictores es el tamaño de la muestra. ¿Y por qué este problema se resuelve usando una red elástica donde aumento el problema a variables que claramente exceden .