Como explicación alternativa, considere la siguiente intuición:
Al minimizar un error, debemos decidir cómo penalizar estos errores. De hecho, el enfoque más directo para penalizar errores sería utilizar una linearly proportional
función de penalización. Con tal función, a cada desviación de la media se le asigna un error proporcional correspondiente. Por lo tanto, el doble de la media daría como resultado el doble de penalización.
El enfoque más común es considerar una squared proportional
relación entre las desviaciones de la media y la penalización correspondiente. Esto asegurará que cuanto más lejos esté de la media, proporcionalmente más será penalizado. Usando esta función de penalización, los valores atípicos (lejos de la media) se consideran proporcionalmente más informativos que las observaciones cercanas a la media.
Para dar una visualización de esto, simplemente puede trazar las funciones de penalización:
Ahora, especialmente cuando se considera la estimación de regresiones (p. Ej., OLS), las diferentes funciones de penalización producirán resultados diferentes. Usando la linearly proportional
función de penalización, la regresión asignará menos peso a los valores atípicos que cuando se utiliza la squared proportional
función de penalización. Por lo tanto, se sabe que la Desviación absoluta media (MAD) es un estimador más robusto . En general, por lo tanto, un estimador robusto se ajusta bien a la mayoría de los puntos de datos pero 'ignora' los valores atípicos. Un ajuste de mínimos cuadrados, en comparación, se atrae más hacia los valores atípicos. Aquí hay una visualización para comparar:
Ahora, aunque OLS es más o menos el estándar, ciertamente también se utilizan diferentes funciones de penalización. Como ejemplo, puede echar un vistazo a la función de ajuste robusto de Matlab que le permite elegir una función de penalización diferente (también llamada 'peso') para su regresión. Las funciones de penalización incluyen andrews, bisquare, cauchy, fair, huber, logistic, ols, talwar y welsch. Sus expresiones correspondientes también se pueden encontrar en el sitio web.
Espero que eso te ayude a tener un poco más de intuición para las funciones de penalización :)
Actualizar
Si tiene Matlab, puedo recomendarle jugar con el diseño robusto de Matlab , que fue creado específicamente para la comparación de mínimos cuadrados ordinarios con regresión robusta:
La demostración le permite arrastrar puntos individuales e inmediatamente ver el impacto tanto en los mínimos cuadrados ordinarios como en la regresión robusta (¡lo cual es perfecto para propósitos de enseñanza!).