Esto es correcto: los bosques aleatorios discretizan las variables continuas ya que se basan en árboles de decisión, que funcionan a través de particiones binarias recursivas. Pero con suficientes datos y suficientes divisiones, una función de paso con muchos pasos pequeños puede aproximarse a una función fluida. Entonces esto no tiene por qué ser un problema. Si realmente desea capturar una respuesta uniforme de un solo predictor, calcule el efecto parcial de cualquier variable particular y ajuste una función uniforme (esto no afecta el modelo en sí, que conservará este carácter gradual).
Los bosques aleatorios ofrecen bastantes ventajas sobre las técnicas de regresión estándar para algunas aplicaciones. Por mencionar solo tres:
- Permiten el uso arbitrario de muchos predictores (es posible tener más predictores que puntos de datos)
- Pueden aproximar formas complejas no lineales sin una especificación a priori
- Pueden capturar interacciones complejas entre predicciones sin una especificación a priori .
En cuanto a si es una regresión "verdadera", esto es algo semántico. Después de todo, la regresión por partes también es regresión, pero tampoco es uniforme. Como es cualquier regresión con un predictor categórico, como se señala en los comentarios a continuación.