Preguntas etiquetadas con unbalanced-classes

Los datos organizados en categorías discretas o * clases * pueden presentar problemas para ciertos análisis si el número de observaciones (n) perteneciente a cada clase no es constante en todas las clases. Clases con desigualn están * desequilibrados *.













2
¿Cómo manejar la diferencia entre la distribución del conjunto de prueba y el conjunto de entrenamiento?
Creo que una suposición básica del aprendizaje automático o la estimación de parámetros es que los datos invisibles provienen de la misma distribución que el conjunto de entrenamiento. Sin embargo, en algunos casos prácticos, la distribución del conjunto de prueba será casi diferente del conjunto de entrenamiento. Digamos para un …

3
Clasificación / evaluación de métricas para datos altamente desequilibrados
Trato con un problema de detección de fraude (similar a la calificación crediticia). Como tal, existe una relación altamente desequilibrada entre las observaciones fraudulentas y no fraudulentas. http://blog.revolutionanalytics.com/2016/03/com_class_eval_metrics_r.html proporciona una excelente visión general de las diferentes métricas de clasificación. Precision and Recallo kappaambos parecen ser una buena opción: Una forma …


Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.