¿Qué clasificadores de aprendizaje automático son los más paralelizables? Si tuviera un problema de clasificación difícil, tiempo limitado, pero una LAN decente de computadoras para trabajar, ¿qué clasificadores probaría?
Por supuesto, me parece que algunos clasificadores estándar que conozco se apilan de la siguiente manera, pero podría estar totalmente equivocado:
Bosques aleatorios: muy paralelizables siempre y cuando cada máquina pueda contener todos los datos (es decir, no pueden dividir los datos de entrenamiento per se, pero por lo demás son paralelizables).
Impulso -?
Máquina de vectores de soporte: no muy paralelizable.
Árboles de decisión: se pueden dividir en parte, pero no de manera muy eficiente.