Las páginas de ayuda en R suponen que sé lo que significan esos números, pero no lo sé. Estoy tratando de entender intuitivamente cada número aquí. Solo publicaré el resultado y comentaré lo que descubrí. Puede haber (habrá) errores, ya que escribiré lo que supongo. Principalmente me gustaría saber qué significa el valor t en los coeficientes y por qué imprimen el error estándar residual.
Call:
lm(formula = iris$Sepal.Width ~ iris$Petal.Width)
Residuals:
Min 1Q Median 3Q Max
-1.09907 -0.23626 -0.01064 0.23345 1.17532
Este es un resumen de 5 puntos de los residuos (su media es siempre 0, ¿verdad?). Los números se pueden usar (supongo que aquí) para ver rápidamente si hay grandes valores atípicos. También puede verlo aquí si los residuos están lejos de estar normalmente distribuidos (deberían estar normalmente distribuidos).
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.30843 0.06210 53.278 < 2e-16 ***
iris$Petal.Width -0.20936 0.04374 -4.786 4.07e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Estimaciones , calculadas por regresión de mínimos cuadrados. Además, el error estándar es . Me gustaría saber cómo se calcula esto. No tengo idea de dónde provienen el valor t y el valor p correspondiente. Sé que debería estar distribuido normalmente, pero ¿cómo se calcula el valor t?
Residual standard error: 0.407 on 148 degrees of freedom
, supongo. Pero, ¿por qué calculamos eso y qué nos dice?
Multiple R-squared: 0.134, Adjusted R-squared: 0.1282
, que es . La relación es cercana a 1 si los puntos se encuentran en una línea recta, y 0 si son aleatorios. ¿Cuál es el R cuadrado ajustado?
F-statistic: 22.91 on 1 and 148 DF, p-value: 4.073e-06
F y p para todo el modelo, no solo para s como antes. El valor F es . Cuanto más grande crece, más improbable es que los 's no tengan ningún efecto en absoluto.