Generalmente no, pero potencialmente sí bajo una especificación errónea. El problema que está buscando se llama admisibilidad. Una decisión es admisible si no hay una forma menos arriesgada de calcularla.
Todas las soluciones bayesianas son admisibles y las soluciones no bayesianas son admisibles en la medida en que coincidan con una solución bayesiana en cada muestra o en el límite. Una solución Frequentista o Bayesiana admisible siempre superará a una solución ML a menos que también sea admisible. Dicho esto, hay algunos comentarios prácticos que hacen que esta afirmación sea verdadera pero vacía.
Primero, lo anterior para la opción bayesiana tiene que ser tu prioridad real y no una distribución previa utilizada para hacer feliz a un editor en una revista. En segundo lugar, muchas soluciones frequentistas son inadmisibles y se debería haber utilizado un estimador de contracción en lugar de la solución estándar. Mucha gente desconoce el lema de Stein y sus implicaciones para el error fuera de la muestra. Finalmente, ML puede ser un poco más robusto, en muchos casos, para errores de especificación errónea.
Cuando te mueves hacia los árboles de decisión y sus primos en los bosques, no estás usando una metodología similar a menos que también estés usando algo similar a una red Bayes. Una solución gráfica contiene una cantidad sustancial de información implícita, particularmente un gráfico dirigido. Cada vez que agrega información a un proceso probabilístico o estadístico, reduce la variabilidad del resultado y cambia lo que se consideraría admisible.
Si observa el aprendizaje automático desde una perspectiva de composición de funciones, simplemente se convierte en una solución estadística, pero utiliza aproximaciones para hacer que la solución sea manejable. Para las soluciones bayesianas, MCMC ahorra cantidades increíbles de tiempo al igual que el descenso de gradiente para muchos problemas de ML. Si hubiera tenido que construir un posterior exacto para integrar o utilizar la fuerza bruta en muchos problemas de ML, el sistema solar habría muerto antes de obtener una respuesta.
Supongo que tiene un modelo mal especificado para aquellos que usan estadísticas o estadísticas inapropiadas. Enseñé una conferencia donde probé que los recién nacidos flotarían en las ventanas si no se envuelven adecuadamente y donde un método bayesiano superó radicalmente al método frequentista en una elección multinomial que el método frequentista llegó incluso a la expectativa, mientras que el método bayesiano duplicó el dinero de los participantes. . Ahora abusé de las estadísticas en el primero y aproveché la inadmisibilidad del estimador frecuente en el segundo, pero un usuario ingenuo de estadísticas podría hacer fácilmente lo que hice. Simplemente los hice extremos para hacer obvios los ejemplos, pero utilicé datos absolutamente reales.
Los bosques aleatorios son estimadores consistentes y parecen parecerse a ciertos procesos bayesianos. Debido a la vinculación con los estimadores del núcleo, pueden estar bastante cerca. Si ve una diferencia material en el rendimiento entre los tipos de solución, entonces hay algo en el problema subyacente que está malentendiendo y si el problema tiene alguna importancia, entonces realmente necesita buscar la fuente de la diferencia, ya que también puede ser caso de que todos los modelos estén mal especificados.