Me gustaría probar mi modelo entrenado en un conjunto de datos desequilibrado. ¿Hay algún algoritmo disponible para generar datos sintéticos a partir de un conjunto de datos etiquetado equilibrado (spam / no spam)?
Siempre puede desequilibrar cualquier conjunto de datos simplemente submuestreando una clase.
—
user2974951