Preguntas etiquetadas con classification

La clasificación estadística es el problema de identificar la subpoblación a la que pertenecen las nuevas observaciones, donde se desconoce la identidad de la subpoblación, sobre la base de un conjunto de entrenamiento de datos que contienen observaciones cuya subpoblación es conocida. Por lo tanto, estas clasificaciones mostrarán un comportamiento variable que puede ser estudiado por las estadísticas.

1
Beneficios del muestreo estratificado versus aleatorio para generar datos de entrenamiento en clasificación
Me gustaría saber si existen algunas / algunas ventajas de usar el muestreo estratificado en lugar del muestreo aleatorio, al dividir el conjunto de datos original en un conjunto de entrenamiento y prueba para la clasificación. Además, ¿el muestreo estratificado introduce más sesgos en el clasificador que el muestreo aleatorio? …

2
¿El bosque al azar está sobreajustado?
Estoy experimentando con bosques aleatorios con scikit-learn y obtengo excelentes resultados de mi conjunto de entrenamiento, pero resultados relativamente pobres en mi conjunto de pruebas ... Aquí está el problema (inspirado en el póker) que estoy tratando de resolver: Dadas las cartas de mano del jugador A, las cartas de …

3
Aprendizaje semi-supervisado, aprendizaje activo y aprendizaje profundo para la clasificación.
Edición final con todos los recursos actualizados: Para un proyecto, estoy aplicando algoritmos de aprendizaje automático para la clasificación. Reto: datos etiquetados bastante limitados y muchos más datos sin etiquetar. Metas: Aplicar clasificación semi-supervisada Aplicar un proceso de etiquetado semi-supervisado de alguna manera (conocido como aprendizaje activo) He encontrado mucha …



5
Clasificación de texto a gran escala
Estoy buscando hacer una clasificación en mis datos de texto. Tengo 300 classes200 documentos de capacitación por clase (más o menos 60000 documents in total) y es probable que esto genere datos dimensionales muy altos (es posible que estemos buscando más de 1 millón de dimensiones ). Me gustaría realizar …

10
Conjuntos de datos de redes sociales
Bloqueado . Esta pregunta y sus respuestas están bloqueadas porque la pregunta está fuera de tema pero tiene un significado histórico. Actualmente no acepta nuevas respuestas o interacciones. Estoy buscando conjuntos de datos de redes sociales (twitter, friendfeed, facebook, lastfm, etc.) para tareas de clasificación, preferiblemente en formato arff. Mis …


2
¿Por qué el clasificador de regresión de cresta funciona bastante bien para la clasificación de texto?
Durante un experimento para la clasificación de texto, encontré que el clasificador de cresta genera resultados que constantemente superan las pruebas entre los clasificadores que se mencionan y aplican con mayor frecuencia para las tareas de minería de texto, como SVM, NB, kNN, etc. Sin embargo, no he elaborado en …

2
Prueba de clasificación en datos de desequilibrio sobremuestreados
Estoy trabajando en datos gravemente desequilibrados. En la literatura, se utilizan varios métodos para reequilibrar los datos mediante re-muestreo (sobremuestreo o submuestreo). Dos buenos enfoques son: SMOTE: Técnica de sobremuestreo de minorías sintéticas ( SMOTE ) ADASYN: Enfoque de muestreo sintético adaptativo para el aprendizaje desequilibrado ADASYN ) He implementado …





3
Comparación de dos resultados de precisión del clasificador para la significación estadística con la prueba t
Quiero comparar la precisión de dos clasificadores para la significación estadística. Ambos clasificadores se ejecutan en el mismo conjunto de datos. Esto me lleva a creer que debería estar usando una prueba t de una muestra de lo que he estado leyendo . Por ejemplo: Classifier 1: 51% accuracy Classifier …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.