Estadísticas y Big Data classification

5

Busqué por todos lados y no he podido averiguar qué significan o significan las AUC, en relación con la predicción.

228 classification prediction roc auc abbreviation

4

Elección de K en validación cruzada K-fold

He estado usando el -fold validación cruzada varias veces para evaluar el rendimiento de algunos algoritmos de aprendizaje, pero siempre he estado intrigados por la forma en que debería elegir el valor de .KKKKKKK A menudo he visto y usado un valor de , pero esto me parece totalmente arbitrario, …

136 machine-learning classification cross-validation

4

Kappa de Cohen en inglés simple

Estoy leyendo un libro de minería de datos y menciona la estadística Kappa como un medio para evaluar el rendimiento de predicción de los clasificadores. Sin embargo, simplemente no puedo entender esto. También revisé Wikipedia, pero tampoco me ayudó: https://en.wikipedia.org/wiki/Cohen's_kappa . ¿Cómo ayuda Coap's kappa a evaluar el rendimiento de …

131 classification data-mining cohens-kappa

5

¿Cómo funciona una máquina de vectores de soporte (SVM)?

¿Cómo funciona una máquina de vectores de soporte (SVM) de trabajo, y lo que lo diferencia de otros clasificadores lineales, como el perceptrón lineal , análisis discriminante lineal o regresión logística ? * * (* Estoy pensando en términos de las motivaciones subyacentes para el algoritmo, las estrategias de optimización, …

109 machine-learning classification svm statistical-learning

7

¿Por qué la precisión no es la mejor medida para evaluar los modelos de clasificación?

Esta es una pregunta general que se hizo indirectamente varias veces aquí, pero carece de una única respuesta autorizada. Sería genial tener una respuesta detallada a esto para la referencia. La precisión , la proporción de clasificaciones correctas entre todas las clasificaciones, es una medida muy simple y muy "intuitiva", …

107 machine-learning classification accuracy model-evaluation scoring-rules

3

¿Cómo se calcula la precisión y la recuperación para la clasificación multiclase utilizando la matriz de confusión?

Me pregunto cómo calcular la precisión y la recuperación utilizando una matriz de confusión para un problema de clasificación de varias clases. Específicamente, una observación solo se puede asignar a su clase / etiqueta más probable. Me gustaría calcular: Precisión = TP / (TP + FP) Recuperación = TP / …

92 machine-learning classification precision-recall multi-class

5

Cómo calcular el área bajo la curva (AUC), o la estadística c, a mano

Estoy interesado en calcular el área bajo la curva (AUC), o la estadística c, a mano para un modelo de regresión logística binaria. Por ejemplo, en el conjunto de datos de validación, tengo el valor verdadero para la variable dependiente, retención (1 = retenido; 0 = no retenido), así como …

78 regression logistic classification roc auc

3

¿Cómo producir una bonita gráfica de los resultados del análisis de conglomerados k-means?

Estoy usando R para hacer clustering K-means. Estoy usando 14 variables para ejecutar K-means ¿Cuál es una manera bonita de trazar los resultados de K-means? ¿Hay implementaciones existentes? ¿Tener 14 variables complica el trazado de los resultados? Encontré algo llamado GGcluster que se ve genial pero todavía está en desarrollo. …

77 data-visualization classification k-means unsupervised-learning

1

Ayúdame a entender las máquinas de vectores de soporte

Entiendo los conceptos básicos de cuál es el objetivo de Support Vector Machines en términos de clasificar un conjunto de entrada en varias clases diferentes, pero lo que no entiendo son algunos de los detalles esenciales. Para empezar, estoy un poco confundido por el uso de Slack Variables. ¿Cuál es …

76 machine-learning classification svm

6

Selección de características para el modelo "final" cuando se realiza la validación cruzada en el aprendizaje automático

Estoy un poco confundido acerca de la selección de funciones y el aprendizaje automático y me preguntaba si podrían ayudarme. Tengo un conjunto de datos de microarrays que se clasifica en dos grupos y tiene miles de características. Mi objetivo es obtener una pequeña cantidad de genes (mis características) (10-20) …

76 machine-learning classification cross-validation feature-selection genetics

3

¿Por qué la regresión logística no se llama clasificación logística?

Dado que la Regresión logística es un modelo de clasificación estadística que trata con variables dependientes categóricas, ¿por qué no se llama Clasificación logística ? ¿No debería reservarse el nombre de "Regresión" a los modelos que manejan variables dependientes continuas?

75 regression machine-learning logistic classification terminology

3

¿La mejor manera de presentar un bosque aleatorio en una publicación?

Estoy usando el algoritmo de bosque aleatorio como un clasificador robusto de dos grupos en un estudio de microarrays con miles de características. ¿Cuál es la mejor manera de presentar el bosque aleatorio para que haya suficiente información para que sea reproducible en un documento? ¿Existe un método de trazado …

75 r machine-learning classification random-forest microarray

4

¿Por qué las redes neuronales se vuelven más profundas, pero no más anchas?

En los últimos años, las redes neuronales convolucionales (o quizás redes neuronales profundas en general) se han vuelto cada vez más profundas, con redes de vanguardia que van de 7 capas ( AlexNet ) a 1000 capas ( Redes residuales) en el espacio de 4 años. La razón detrás del …

73 machine-learning classification neural-networks deep-learning conv-neural-network

8

¿Cómo calcular la precisión / recuperación para la clasificación multiclase-multilabel?

Me pregunto cómo calcular las medidas de precisión y recuperación para la clasificación multiclase multicabel, es decir, la clasificación donde hay más de dos etiquetas y cada instancia puede tener varias etiquetas.

72 machine-learning classification precision-recall multi-class

4

¿Cómo trazar curvas ROC en clasificación multiclase?

En otras palabras, en lugar de tener un problema de dos clases, estoy lidiando con 4 clases y todavía me gustaría evaluar el rendimiento utilizando AUC.

66 classification roc

Preguntas etiquetadas con classification