En todos los documentos forestales aleatorios (de regresión) que he leído, cuando llega el momento de reunir las predicciones de todos los árboles, tomamos el valor promedio como la predicción.
Mi pregunta es ¿por qué hacemos eso?
¿Existe una justificación estadística para tomar el promedio?
EDITAR: Para aclarar la pregunta, sé que es posible usar otras funciones de agregación (usamos el modo de clasificación), estoy interesado principalmente en si existe alguna justificación teórica detrás de la elección de la función promedio.