Coeficiente de determinación en regresión lineal múltiple: en la regresión lineal múltiple, el coeficiente de determinación puede escribirse en términos de las correlaciones por pares para las variables usando la forma cuadrática:
R2= rTy , xr- 1x , xry , x,
donde es el vector de correlaciones entre el vector de respuesta y cada uno de los vectores explicativos, y es la matriz de correlaciones entre los vectores explicativos (para más información, consulte esta pregunta relacionada ). En el caso de una regresión bivariada tienes:ry , xrx , x
R2= [ rY, X1rY, X2]T[ 1rX1, X2rX1, X21]- 1[ rY, X1rY, X2]= 11 - r2X1, X2[ rY, X1rY, X2]T[ 1- rX1, X2- rX1, X21] [ rY, X1rY, X2]= 11 - r2X1, X2( r2Y, X1+ r2Y, X2- 2 rX1, X2rY, X1rY, X2) .
No especificó las direcciones de las correlaciones univariadas en su pregunta, por lo que sin pérdida de generalidad, denotaremos . Sustituyendo sus valores y produce:D ≡ sgn ( rY, X1) ⋅ sgn ( rY, X2) ∈ { - 1 , + 1 }r2Y, X1= 0.3r2Y,X2=0.4
R2=0.7−20.12−−−−√⋅D⋅rX1,X21−r2X1,X2.
Es posible que , ya que es posible que la información combinada de las dos variables sea más que la suma de sus partes. Este fenómeno interesante se llama "mejora" (véase, por ejemplo, Lewis y Escobar 1986 ).R2>0.7