R: Anova y regresión lineal


9

Soy nuevo en estadística y estoy tratando de entender la diferencia entre ANOVA y regresión lineal. Estoy usando R para explorar esto. Leí varios artículos sobre por qué ANOVA y la regresión son diferentes, pero siguen siendo los mismos y cómo se puede visualizar, etc. Creo que soy bonita, pero aún falta un poco.

Entiendo que ANOVA compara la varianza dentro de los grupos con la varianza entre grupos para determinar si existe o no una diferencia entre cualquiera de los grupos evaluados. ( https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA )

Para la regresión lineal, encontré una publicación en este foro que dice que lo mismo se puede probar cuando probamos si b (pendiente) = 0. ( ¿Por qué se enseña / usa ANOVA como si fuera una metodología de investigación diferente en comparación con la regresión lineal? )

Para más de dos grupos encontré un sitio web que decía:

La hipótesis nula es: H0 0:µ1=µ2=µ3

El modelo de regresión lineal es: y=si0 0+si1X1+si2X2+mi

Sin embargo, la salida de la regresión lineal es la intercepción para un grupo y la diferencia a esta intercepción para los otros dos grupos. ( http://www.real-statistics.com/multiple-regression/anova-using-regression/ )

Para mí, esto parece que en realidad se comparan las intersecciones y no las pendientes.

Otro ejemplo en el que comparan las intersecciones en lugar de las pendientes se puede encontrar aquí: ( http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/ )

Ahora me cuesta entender qué se compara realmente en la regresión lineal. las pendientes, las intersecciones o ambas?


Respuestas:


16

esto parece que en realidad se comparan las intersecciones y no las pendientes?

Su confusión allí se relaciona con el hecho de que debe ser muy cuidadoso para tener claro qué intersecciones y pendientes quiere decir (¿interceptar qué? ¿Pendiente de qué?).

El papel de un coeficiente de un ficticio 0-1 en una regresión puede considerarse como una pendiente y como una diferencia de intersecciones.

Simplifiquemos las cosas lo más posible, considerando un caso de dos muestras.

Todavía podemos hacer ANOVA unidireccional con dos muestras, pero resulta ser esencialmente lo mismo que una prueba t de dos muestras de dos colas (el caso de varianza igual).

Aquí hay un diagrama de la situación de la población:

dos grupos significan como regresión, situación de la población

Si , entonces el modelo lineal de población esδ=μ2-μ1

y=μ1+δX+mi

X=0 0yμ1+δ×0 0=μ1X=1yμ1+δ×1=μ1+μ2-μ1=μ2

δ

Para ayudar con la concreción, aquí hay dos muestras:

Group1:  9.5  9.8 11.8
Group2: 11.0 13.4 12.5 13.9

¿Como se ven?

parcela de muestra

¿Cómo se ve la prueba de diferencia de medios?

Como prueba t:

    Two Sample t-test

data:  values by group
t = -5.0375, df = 5, p-value = 0.003976
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -4.530882 -1.469118
sample estimates:
mean in group g1 mean in group g2 
             9.9             12.9 

Como una regresión:

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   9.9000     0.4502  21.991 3.61e-06 ***
groupg2       3.0000     0.5955   5.037  0.00398 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 0.7797 on 5 degrees of freedom
Multiple R-squared:  0.8354,    Adjusted R-squared:  0.8025 
F-statistic: 25.38 on 1 and 5 DF,  p-value: 0.003976

Podemos ver en la regresión que el término de intercepción es la media del grupo 1, y el coeficiente groupg2 (coeficiente 'pendiente') es la diferencia en las medias grupales. Mientras tanto, el valor p para la regresión es el mismo que el valor p para la prueba t (0.003976)


Muchas gracias por este ejemplo extremadamente útil. Me acabo de dar cuenta de que todavía hay una pregunta abierta. No entiendo por qué la pendiente se denota como μ2 − μ1? ¿No se define la pendiente como m = delta Y / delta X?
Paul

2
ΔX=1-0 0=1Δy=(μ1+δ×1)-(μ1+δ×0 0)=δ=μ2-μ1Δy/ /ΔX=(μ2-μ1)/ /1=μ2-μ1

¡+1 la ilustración gráfica de por qué la pendiente es igual a la diferencia en los medios me ayudó mucho!
Haitao Du
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.