Un hiperparámetro es simplemente un parámetro que impacta, total o parcialmente, otros parámetros. No resuelven directamente el problema de optimización que enfrenta, sino que optimizan los parámetros que pueden resolver el problema (de ahí el hiper , porque no son parte del problema de optimización, sino que son "complementos"). Por lo que he visto, pero no tengo referencia, esta relación es unidireccional (un hiperparámetro no puede ser influenciado por los parámetros en los que tiene influencia, por lo tanto, también el hiper ). Por lo general, se introducen en esquemas de regularización o metaoptimización.
Por ejemplo, su parámetro puede impactar libremente en y para ajustar el costo de regularización (pero y no tienen influencia en ). Por lo tanto, es un hiperparámetro para y . Si tuviera un parámetro adicional que influye en , sería un hiperparámetro para y un hiperparámetro para y (pero nunca he visto esta nomenclatura, pero no creo que esté mal si lo vi)λμσμσλλμστλλμσ
Encontré el concepto de hiperparámetro muy útil para la validación cruzada, porque le recuerda la jerarquía de parámetros, al tiempo que le recuerda que si todavía está modificando (hiper) parámetros, todavía está validando de forma cruzada y no generalizando, por lo que debe Tenga cuidado con sus conclusiones (para evitar el pensamiento circular).