Soy nuevo en estadística y estoy tratando de entender la diferencia entre ANOVA y regresión lineal. Estoy usando R para explorar esto. Leí varios artículos sobre por qué ANOVA y la regresión son diferentes, pero siguen siendo los mismos y cómo se puede visualizar, etc. Creo que soy bonita, pero aún falta un poco.
Entiendo que ANOVA compara la varianza dentro de los grupos con la varianza entre grupos para determinar si existe o no una diferencia entre cualquiera de los grupos evaluados. ( https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA )
Para la regresión lineal, encontré una publicación en este foro que dice que lo mismo se puede probar cuando probamos si b (pendiente) = 0. ( ¿Por qué se enseña / usa ANOVA como si fuera una metodología de investigación diferente en comparación con la regresión lineal? )
Para más de dos grupos encontré un sitio web que decía:
La hipótesis nula es:
El modelo de regresión lineal es:
Sin embargo, la salida de la regresión lineal es la intercepción para un grupo y la diferencia a esta intercepción para los otros dos grupos. ( http://www.real-statistics.com/multiple-regression/anova-using-regression/ )
Para mí, esto parece que en realidad se comparan las intersecciones y no las pendientes.
Otro ejemplo en el que comparan las intersecciones en lugar de las pendientes se puede encontrar aquí: ( http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/ )
Ahora me cuesta entender qué se compara realmente en la regresión lineal. las pendientes, las intersecciones o ambas?