¿Cuál es su opinión sobre el sobremuestreo en la clasificación en general, y el algoritmo SMOTE en particular? ¿Por qué no solo aplicaríamos un costo / penalización para ajustar el desequilibrio en los datos de clase y cualquier costo de error no balanceado? Para mis propósitos, la precisión de la predicción para un conjunto futuro de unidades experimentales es la medida definitiva.
Como referencia, el artículo SMOTE: http://www.jair.org/papers/paper953.html