Además de las características obvias del clasificador como
- costo computacional,
- tipos de datos esperados de características / etiquetas y
- idoneidad para ciertos tamaños y dimensiones de conjuntos de datos,
¿Cuáles son los cinco clasificadores principales (¿o 10, 20?) para probar primero en un nuevo conjunto de datos sobre el que aún no se sabe mucho (por ejemplo, semántica y correlación de características individuales)? Por lo general, pruebo Naive Bayes, Nearest Neighbour, Decision Tree y SVM, aunque no tengo una buena razón para esta selección aparte de conocerlos y sobre todo entender cómo funcionan.
Supongo que uno debería elegir clasificadores que cubran los enfoques de clasificación general más importantes . ¿Qué selección recomendaría, de acuerdo con ese criterio o por cualquier otro motivo?
ACTUALIZACIÓN: Una formulación alternativa para esta pregunta podría ser: "¿Qué enfoques generales de clasificación existen y qué métodos específicos cubren los más importantes / populares / prometedores?"