Dados puntos de datos , en el plano, dibujemos una línea recta
. Si predecimos como el valor de , entonces el error es , el error al cuadrado es
, y el error al cuadrado total . Le pedimos( x i , y i ) , i = 1 , 2 , ... n y = un x + b una x i + b y i y i ( y i - y i ) = ( y i - un x i - b ) ( y i - a x i - bn(xi,yi),i=1,2,…ny=ax+baxi+by^iyi(yi−y^i)=(yi−axi−b)∑ n i = 1 ( y i - a x i - b ) 2(yi−axi−b)2 ∑ni=1(yi−axi−b)2
¿Qué opción de y minimiza
?b S = n ∑ i = 1 ( y i - a x i - b ) 2abS=∑i=1n(yi−axi−b)2
Dado que es la distancia vertical de desde la línea recta, estamos pidiendo la línea de manera que la suma de los cuadrados de las distancias verticales de los puntos desde la línea sea tan pequeña como posible. Ahora es una función cuadrática de y y alcanza su valor mínimo cuando y son tales que
De la segunda ecuación, obtenemos
donde
( x i , y i ) S a b a b ∂ S(yi−axi−b)(xi,yi)Sabab b=1
∂S∂a∂S∂b=2∑i=1n(yi−axi−b)(−xi)=2∑i=1n(yi−axi−b)(−1)=0=0
μy=1b=1n∑i=1n(yi−axi)=μy−aμx
yixia=( 1μy=1n∑i=1nyi, μx=1n∑i=1nxi son el promedio aritmético valores de 's y ' s respectivamente. Sustituyendo en la primera ecuación, obtenemos
Por lo tanto, la línea que minimiza se puede expresar como
y el valor mínimo de es
yixiSy=ax+b=μy+((1a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x.
SSSmin=[(1y=ax+b=μy+((1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x)(x−μx),
SSmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1x2i)−μ2x.
Si intercambiamos los roles de e , dibuje una línea
, y solicite los valores de
y que minimizan
es decir, queremos la línea tal que la suma de los cuadrados de las distancias horizontales de los puntos desde el la línea es lo más pequeña posible, entonces obtenemosxyx=a^y+b^a^b^
T=∑i=1n(xi−a^yi−b^)2,
x=a^y+b^=μx+((1n∑ni=1xiyi)−μxμy(1n∑ni=1y2i)−μ2y)(y−μy)
y el valor mínimo de es
TTmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1y2i)−μ2y.
Tenga en cuenta que ambas líneas pasan por el punto
pero las pendientes son
son diferentes en general. De hecho, como @whuber señala en un comentario, las pendientes son las mismas cuando todos los puntos encuentran en la misma línea recta. Para ver esto, tenga en cuenta que
(μx,μy)
a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x, a^−1=(1n∑ni=1y2i)−μ2y(1n∑ni=1xiyi)−μxμy
(xi,yi)a^−1−a=Smin(1n∑ni=1xiyi)−μxμy=0⇒Smin=0⇒yi=axi+b,i=1,2,…,n.