Preguntas etiquetadas con classification

La clasificación estadística es el problema de identificar la subpoblación a la que pertenecen las nuevas observaciones, donde se desconoce la identidad de la subpoblación, sobre la base de un conjunto de entrenamiento de datos que contienen observaciones cuya subpoblación es conocida. Por lo tanto, estas clasificaciones mostrarán un comportamiento variable que puede ser estudiado por las estadísticas.

2
Es precisión = 1- tasa de error de prueba
Disculpas si esta es una pregunta muy obvia, pero he estado leyendo varias publicaciones y parece que no puedo encontrar una buena confirmación. En el caso de la clasificación, ¿la precisión de un clasificador es = 1- tasa de error de prueba ? Obtengo que la precisión es , pero …



4
¿Cómo interpretar una curva ROC?
Apliqué la regresión logística a mis datos en SAS y aquí están la curva ROC y la tabla de clasificación. Me siento cómodo con las figuras en la tabla de clasificación, pero no estoy exactamente seguro de lo que muestran la curva roc y el área debajo de ella. Cualquier …




4
¿Debería preocuparse la multicolinealidad cuando se utilizan modelos no lineales?
Digamos que tenemos un problema de clasificación binaria con características principalmente categóricas. Utilizamos algún modelo no lineal (por ejemplo, XGBoost o Random Forests) para aprenderlo. ¿Debería preocuparse por la multicolinealidad? ¿Por qué? Si la respuesta a lo anterior es verdadera, ¿cómo debería uno luchar contra ella teniendo en cuenta que …

3
¿Cómo se pueden usar los modelos de aprendizaje automático (GBM, NN, etc.) para el análisis de supervivencia?
Sé que los modelos estadísticos tradicionales como la regresión de riesgos proporcionales de Cox y algunos modelos de Kaplan-Meier se pueden usar para predecir días hasta la próxima ocurrencia de un evento, por ejemplo, falla, etc., es decir, análisis de supervivencia Preguntas ¿Cómo se puede usar la versión de regresión …






1
Paquete GBM vs. Caret usando GBM
He estado usando el ajuste del modelo caret, pero luego volví a ejecutar el modelo usando el gbmpaquete. Entiendo que el caretpaquete usa gbmy el resultado debe ser el mismo. Sin embargo, solo una ejecución de prueba rápida usando data(iris)muestra una discrepancia en el modelo de aproximadamente 5% usando RMSE …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.