Esta es una pregunta en general, no específica de ningún método o conjunto de datos. ¿Cómo lidiamos con un problema de desequilibrio de clase en el aprendizaje automático supervisado donde el número de 0 es alrededor del 90% y el número de 1 es alrededor del 10% en su conjunto de datos? ¿Cómo capacitamos de manera óptima al clasificador?
Una de las formas que sigo es el muestreo para equilibrar el conjunto de datos y luego entrenar al clasificador y repetir esto para múltiples muestras.
Siento que esto es aleatorio. ¿Hay algún marco para abordar este tipo de problemas?