Quiero hacer retroceder la economía de combustible en el desplazamiento del motor, el tipo de combustible, la tracción en 2 contra 4 ruedas, la potencia, la transmisión manual en comparación con la automática, y la cantidad de velocidades. Mi conjunto de datos ( enlace ) contiene vehículos de 2012-2014.
fuelEconomy
en millas por galónengineDisplacement
: tamaño del motor en litrosfuelStd
: 1 para gas 0 para dieselwheelDriveStd
: 1 para 2 ruedas motrices, 0 para 4 ruedas motriceshp
: caballos de fuerzatransStd
: 1 para automático, 0 para manualtransSpeed
: Número de velocidades
Código R:
reg = lm(fuelEconomy ~ engineDisplacement + fuelStd + wheelDriveStd + hp +
transStd + transSpeed, data = a)
summary(reg)
Call:
lm(formula = fuelEconomy ~ engineDisplacement + fuelStd + wheelDriveStd +
hp + transStd + transSpeed, data = a)
Residuals:
Min 1Q Median 3Q Max
-10.2765 -2.3142 -0.0655 2.0944 15.8637
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 48.147115 0.542910 88.683 < 2e-16 ***
engineDisplacement -3.673549 0.091272 -40.248 < 2e-16 ***
fuelStd -6.613112 0.403989 -16.370 < 2e-16 ***
wheelDriveStd 2.778134 0.137775 20.164 < 2e-16 ***
hp -0.005884 0.001008 -5.840 5.86e-09 ***
transStd -0.351853 0.157570 -2.233 0.0256 *
transSpeed -0.080365 0.052538 -1.530 0.1262
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 3.282 on 2648 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.7802, Adjusted R-squared: 0.7797
F-statistic: 1566 on 6 and 2648 DF, p-value: < 2.2e-16
- ¿Los resultados son realistas o estoy haciendo algo mal aquí ya que la mayoría de las variables son altamente significativas estadísticamente?
- ¿Es mejor usar otros modelos para este propósito?
- ¿Es ese resultado utilizable para la interpretación?