Preguntas:
- ¿Cuál es la diferencia (s) entre los árboles de regresión potenciados (BRT) y los modelos potenciados generalizados (GBM)? ¿Se pueden usar indistintamente? ¿Es una una forma específica de la otra?
- ¿Por qué Ridgeway usó la frase "Modelos de regresión aumentada generalizada" (GBM) para describir lo que Friedman había propuesto previamente como "Máquina de aumento gradiente" (GBM)? Estos dos acrónimos son idénticos, describen lo mismo, pero se derivan de diferentes frases.
Antecedentes:
Tengo problemas para determinar cómo difieren los términos BRT y GBM. Por lo que entiendo, ambos son términos para describir árboles de clasificación y regresión que tienen la estocasticidad incorporada a través de algún tipo de refuerzo (por ejemplo, embolsado, arranque, validación cruzada). Además, por lo que deduzco, el término GBM fue acuñado por primera vez por Friedman (2001) en su artículo "Aproximación de la función codiciosa: una máquina de aumento de gradiente". Luego, Ridgeway implementó el procedimiento descrito por Friedman en 2006 en su paquete "Modelos de regresión potenciada generalizada" (GBM). En mi campo (ecología) Elith et al. (2008) fue el primero en demostrar el gbm
paquete de Ridgeway para el modelado de distribución de especies. Sin embargo, los autores en Elith et al. use el término "árbol de regresión impulsado" (BRT) para describir Friedman y Ridgeway '
¿Estoy confundido acerca de si estos términos se pueden usar indistintamente? Es algo confuso que un autor use el mismo acrónimo (de una frase diferente) para describir la misma teoría que propuso un autor anterior. También es confuso que el tercer autor usó un término completamente diferente al describir esta teoría en términos ecológicos.
Lo mejor que se me ocurre es que los BRT son una forma específica de GBM en la que la distribución es binomial, pero no estoy seguro de esto.
Elith y col. defina árboles de regresión potenciados como este ... "Los árboles de regresión potenciados combinan las fortalezas de dos algoritmos: árboles de regresión (modelos que relacionan una respuesta a sus predictores mediante divisiones binarias recursivas) y refuerzo (un método adaptativo para combinar muchos modelos simples para brindar un mejor rendimiento predictivo El modelo BRT final puede entenderse como un modelo de regresión aditiva en el que los términos individuales son árboles simples, ajustados de manera progresiva y progresiva "(Elith et al. 2008).