Me encontré con un rumor de que algunos estudios mostraron que el rendimiento de los modelos predictivos depende más de la experiencia del analista de datos con el método elegido que de la elección del método.
En otras palabras, la afirmación es que es más importante que el analista de datos esté familiarizado con el método elegido que cuán "apropiado" parecería el método para el problema desde un punto de vista más teórico.
Esto se mencionó en el contexto de la quimiometría, que generalmente involucra problemas de muchas variantes (100s - 1000s), colinealidad múltiple y, por supuesto, muy pocas muestras. La predicción puede haber sido clasificación o regresión.
Mi experiencia personal sugiere que esto es plausible , pero se mencionó un estudio (le pregunté a la persona que lo mencionó por correo electrónico después de una búsqueda rápida pero fallida, pero nunca recibí ninguna respuesta). Sin embargo, también con una búsqueda más elaborada, no pude localizar ningún documento.
¿Alguien está al tanto de tales hallazgos? Si no, ¿qué dice la experiencia personal de Big Guys aquí?