Debería parcial coincidir con el total en la regresión múltiple?


12

El siguiente es un modelo creado a partir de un mtcarsconjunto de datos:

> ols(mpg~wt+am+qsec, mtcars)

Linear Regression Model

ols(formula = mpg ~ wt + am + qsec, data = mtcars)

                Model Likelihood     Discrimination    
                   Ratio Test           Indexes        
Obs       32    LR chi2     60.64    R2       0.850    
sigma 2.4588    d.f.            3    R2 adj   0.834    
d.f.      28    Pr(> chi2) 0.0000    g        6.456    

Residuals

    Min      1Q  Median      3Q     Max 
-3.4811 -1.5555 -0.7257  1.4110  4.6610 

          Coef    S.E.   t     Pr(>|t|)
Intercept  9.6178 6.9596  1.38 0.1779  
wt        -3.9165 0.7112 -5.51 <0.0001 
am         2.9358 1.4109  2.08 0.0467  
qsec       1.2259 0.2887  4.25 0.0002  

El modelo parece bueno con total de 0,85. Sin embargo, los valores parciales de vistos en la siguiente gráfica no se suman a este valor. Suman hasta aproximadamente 0.28.R 2R2R2

> plot(anova(mod), what='partial R2')

ingrese la descripción de la imagen aquí

¿Hay alguna relación entre la suma de todas parcial y el total de ? El análisis se realiza con paquete.R 2R2R2rms


1
(Además de la muy buena respuesta de ameba) Una pregunta cercana sobre el coeficiente de regresión estandarizado frente a las estadísticas de correlación parcial.stackexchange.com/q/76815/3277 .
ttnphns

Respuestas:


11

No.

Una forma de entender parcial para un predictor dado es que es igual al que obtendrías si primero regresas tu variable independiente en todos los demás predictores , tomas los residuales y regresas aquellos en el predictor restante.R 2R2R2

Entonces, por ejemplo, si todos los predictores son perfectamente idénticos (colineales), uno puede tener decente , pero parcial para todos los predictores será exactamente cero, porque cualquier predictor tiene cero poder explicativo adicional.R 2R2R2

Por otro lado, si todos los predictores juntos explican perfectamente la variable dependiente, es decir, , entonces parcial para cada predictor también será , porque lo que no sea explicado por todos los demás predictores puede explicarse perfectamente por el resto uno.R 2 1R2=1R21

Entonces, la suma de todos los parciales puede estar fácilmente por debajo o por encima del total . No tienen que coincidir incluso si todos los predictores son ortogonales. parcial es una medida un poco extraña.R 2 R 2R2R2R2

Vea este largo hilo para muchos más detalles: Importancia de los predictores en regresión múltiple: parcial vs. coeficientes estandarizadosR2 .


Gracias por una explicación muy clara. Esto podría estar sucediendo en la situación en esta pregunta también: stats.stackexchange.com/questions/155447/… . Entonces, ¿el R ^ 2 parcial es un indicador razonable de importancia o contribución de predictores individuales? ¿O sugeriría algo más como 'proporción R ^ 2' o 'resto R ^ 2' o 'chisq' o 'chisq menos df' o 'proporción chisq' o 'aic'? Todos estos están disponibles en paquete rms. ¿O coeficientes estandarizados?
rnso

Sí, no estoy seguro de por qué esa pregunta se suspendió como poco clara; Creo que está claro (y es casi un duplicado de este, pero podría decirse que no del todo). Con respecto a los indicadores razonables de importancia de los predictores: los invito encarecidamente a leer el hilo al que he vinculado en mi respuesta, que es precisamente sobre esta pregunta. También tengo mi propia respuesta, donde hago una breve descripción de varios indicadores diferentes. Todos tienen varias deficiencias; parece que no hay (y no puede haber) una solución perfecta para este problema.
ameba dice Reinstate Monica

Lo puse en espera tan clara porque ninguna explicación en absoluto se le dio de cómo difieren los dos modelos. Tal vez me equivoqué al pensar que se quería una respuesta para esa situación específica. Dada esta respuesta, ¿alguno de ustedes piensa que necesita reabrirse?
Scortchi - Restablece a Monica

Entonces, el R2 parcial es comparable dentro de un gráfico y no entre 2 gráficos. Además, 'R2 parcial' realmente no indica la contribución al R2 total y, por lo tanto, creo que es un nombre inapropiado. No hay necesidad de otra pregunta ahora ya que tengo la respuesta aquí.
rnso

He estado votando todas las respuestas. Incluso entonces he aceptado la gran mayoría de mis preguntas.
rnso
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.