Preguntas etiquetadas con overfitting

El error de modelado (especialmente el error de muestreo) en lugar de las relaciones replicables e informativas entre las variables mejora las estadísticas de ajuste del modelo, pero reduce la parsimonia y empeora la validez explicativa y predictiva.


1

1
¿Cómo seleccionar el mejor ajuste sin sobreajustar los datos? Modelado de una distribución bimodal con N funciones normales, etc.
Obviamente tengo una distribución de valores bimodal, que busco ajustar. Los datos pueden ajustarse bien con 2 funciones normales (bimodal) o con 3 funciones normales. Además, hay una razón física plausible para ajustar los datos con 3. Cuantos más parámetros se introduzcan, más perfecto será el ajuste, ya que con …

4
Sobreajuste con clasificadores lineales
Hoy nuestro profesor declaró en clase que "no es posible sobreajustar con clasificadores lineales". Considero que eso es incorrecto, ya que incluso los clasificadores lineales pueden ser sensibles a los valores atípicos en el conjunto de entrenamiento; tomemos, por ejemplo, un margen duro. ¿O estoy equivocado? Obviamente, la linealidad probablemente …



2
Explicación lúcida de la "estabilidad numérica de la inversión de la matriz" en la regresión de crestas y su papel en la reducción del sobreajuste
Entiendo que podemos emplear la regularización en un problema de regresión de mínimos cuadrados como w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2 \right] y que este problema tiene una solución de forma cerrada como: w^=(XTX+λI)−1XTy.w^=(XTX+λI)−1XTy.\hat{\boldsymbol{w}} = (\boldsymbol{X}^T\boldsymbol{X}+\lambda\boldsymbol{I})^{-1}\boldsymbol{X}^T\boldsymbol{y}. Vemos que en la segunda ecuación, la regularización es simplemente agregar λλ\lambda …






1
Técnicas para detectar sobreajuste
Tuve una entrevista de trabajo para un puesto de ciencia de datos. Durante la entrevista, me preguntaron qué debo hacer para asegurarme de que el modelo no se ajuste demasiado. Mi primera respuesta fue utilizar la validación cruzada para evaluar el rendimiento del modelo. Sin embargo, el entrevistador dijo que …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.