Estoy lidiando con un problema de clasificación binaria supervisada. Me gustaría usar el paquete GBM para clasificar a las personas como no infectadas / infectadas. Tengo 15 veces más personas no infectadas que infectadas.
Me preguntaba si los modelos GBM sufren en el caso de los tamaños de clase desequilibrados? No encontré ninguna referencia para responder esta pregunta.
Traté de ajustar los pesos asignando un peso de 1 a las personas no infectadas y un peso de 15 a los infectados, pero obtuve malos resultados.