No, eso no es defendible. El gran obstáculo que los procedimientos de selección de modelos están diseñados para superar es que la cardinalidad del verdadero soportees desconocido. (Aquí tenemos que es el coeficiente "verdadero"). Porquees desconocido, un procedimiento de selección de modelo tiene que buscar exhaustivamente en todos los modelos posibles; sin embargo, si supiéramos, podríamos comprobar los modelos , que es mucho menos.|S∗|=∣∣{j:β∗j≠0}∣∣β∗|S∗|2p|S∗|(p|S∗|)
La teoría del lazo se basa en que el parámetro de regularización es lo suficientemente grande como para hacer que el modelo seleccionado sea lo suficientemente escaso. Podría ser que sus 10 características sean demasiadas o muy pocas, ya que no es trivial convertir un límite inferior en en un límite superior en.λλ|S∗|
Sea nuestra estimación basada en datos para , y ponga . Entonces, ¿tal vez está tratando de asegurarse de que para que haya recuperado al menos las características relevantes? ¿O tal vez estás tratando de establecer ese para que sepas que todas las características que has encontrado valen la pena? En estos casos, su procedimiento estaría más justificado si tuviera información previa sobre los tamaños relativos de .β^β∗S^={j:β^j≠0}S∗⊆S^S^⊆S∗S∗
También, nota, puede dejar algunos coeficientes no sancionado al realizar lazo en, por ejemplo, glmnet
.