Tanto el Root-Mean-Square-Error (RMSE) como el coeficiente de determinación ( )R2 ofrecen información diferente, pero complementaria, que debe evaluarse al evaluar su modelo físico. Ninguno de los dos es "mejor", pero algunos informes podrían centrarse más en una métrica dependiendo de la aplicación en particular.
Usaría lo siguiente como una guía muy general para comprender la diferencia entre ambas métricas:
El RMSE le da una idea de cuán cerca (o lejos) están sus valores pronosticados de los datos reales que está intentando modelar. Esto es útil en una variedad de aplicaciones en las que desea comprender la precisión y precisión de las predicciones de su modelo (por ejemplo, modelar la altura del árbol).
Pros
- Es relativamente fácil de entender y comunicar ya que los valores informados están en las mismas unidades que la variable dependiente que se está modelando.
Contras
- Es sensible a los errores grandes (penaliza los errores de predicción grandes más que los errores de predicción más pequeños).
El coeficiente de determinación ( )R2 es útil cuando intenta comprender qué tan bien las variables independientes seleccionadas explican la variabilidad en sus variables dependientes. Esto es útil cuando intenta explicar qué factores podrían estar impulsando el proceso subyacente de interés (por ejemplo, variables climáticas y condiciones del suelo relacionadas con la altura de los árboles).
Pros
- Da una idea general de qué tan bien las variables seleccionadas se ajustan a los datos.
Contras
- R2R2
Por supuesto, lo anterior estará sujeto al tamaño de la muestra y al diseño de la muestra, y a un entendimiento general de que la correlación no implica causalidad.
This value shows how well future outcomes can be predicted by the model
- Esto es extremadamente engañoso y se inclina simplemente hacia el mal . No hay garantía de que un alto coeficiente de determinación en un modelo dado se relacione con qué tan bien se pronosticarán los resultados futuros.