Preguntas etiquetadas con classification

La clasificación estadística es el problema de identificar la subpoblación a la que pertenecen las nuevas observaciones, donde se desconoce la identidad de la subpoblación, sobre la base de un conjunto de entrenamiento de datos que contienen observaciones cuya subpoblación es conocida. Por lo tanto, estas clasificaciones mostrarán un comportamiento variable que puede ser estudiado por las estadísticas.



3
¿Por qué svm no es tan bueno como el árbol de decisión en los mismos datos?
Soy nuevo en el aprendizaje automático y trato de usar scikit-learn (sklearn) para tratar un problema de clasificación. Tanto DecisionTree como SVM pueden entrenar a un clasificador para este problema. Utilizo sklearn.ensemble.RandomForestClassifiery sklearn.svm.SVCpara ajustar los mismos datos de entrenamiento (alrededor de 500,000 entradas con 50 funciones por entrada). El RandomForestClassifier …



1
Técnicas para el aprendizaje incremental en línea del clasificador en datos de flujo
¿Cuáles pueden ser buenas técnicas para enfrentar este problema abstracto? Tiene un flujo de datos de una señal continua, como uno de un sensor físico. Esa señal tiene valores reales (discretizados), sin atributo; Se pueden extraer características adictivas (p. ej., potencia, autocorrelación, entropía). Puede asignar una etiqueta de un conjunto …


1
Árboles de decisión potenciados calibrados en R o MATLAB
En una comparación empírica de algoritmos de aprendizaje supervisados (ICML 2006), los autores (Rich Caruana y Alexandru Niculescu-Mizil) evaluaron varios algoritmos de clasificación (SVM, ANN, KNN, bosques aleatorios, árboles de decisión, etc.) e informaron que los árboles reforzados calibrados clasificado como el mejor algoritmo de aprendizaje en general en ocho …



2
Validación cruzada en una dimensión muy alta (para seleccionar el número de variables utilizadas en una clasificación dimensional muy alta)
Mi pregunta es acerca de la validación cruzada cuando hay muchas más variables que observaciones. Para arreglar ideas, propongo restringir al marco de clasificación en una dimensión muy alta (más características que observación). Problema: Suponga que para cada variable tiene una medida de importancia que medir exactamente el interés de …




1
Codificación de características categóricas de alta cardinalidad (muchas categorías) cuando las características difieren mucho de la cardinalidad
He estado buscando preguntas sobre la codificación de características categóricas, pero no pude encontrar ninguna que discuta mi problema. Disculpas si me lo perdí. Digamos que tenemos un conjunto de datos con variables binarias y nominales de aproximadamente igual importancia cada una. La mayoría de los clasificadores no pueden ocuparse …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.