Preguntas etiquetadas con classification

La clasificación estadística es el problema de identificar la subpoblación a la que pertenecen las nuevas observaciones, donde se desconoce la identidad de la subpoblación, sobre la base de un conjunto de entrenamiento de datos que contienen observaciones cuya subpoblación es conocida. Por lo tanto, estas clasificaciones mostrarán un comportamiento variable que puede ser estudiado por las estadísticas.





3
¿Validación cruzada o bootstrapping para evaluar el rendimiento de la clasificación?
¿Cuál es el método de muestreo más apropiado para evaluar el rendimiento de un clasificador en un conjunto de datos en particular y compararlo con otros clasificadores? La validación cruzada parece ser una práctica estándar, pero he leído que métodos como .632 bootstrap son una mejor opción. Como seguimiento: ¿La …

2
¿Qué tan grande se necesita un conjunto de entrenamiento?
¿Existe un método común utilizado para determinar cuántas muestras de entrenamiento se requieren para entrenar a un clasificador (un LDA en este caso) para obtener un umbral mínimo de precisión de generalización? Lo pregunto porque me gustaría minimizar el tiempo de calibración que generalmente se requiere en una interfaz cerebro-computadora.


2
¿Cómo manejar la diferencia entre la distribución del conjunto de prueba y el conjunto de entrenamiento?
Creo que una suposición básica del aprendizaje automático o la estimación de parámetros es que los datos invisibles provienen de la misma distribución que el conjunto de entrenamiento. Sin embargo, en algunos casos prácticos, la distribución del conjunto de prueba será casi diferente del conjunto de entrenamiento. Digamos para un …


5
¿Alternativas a los árboles de clasificación, con un mejor rendimiento predictivo (p. Ej .: CV)?
Estoy buscando una alternativa a los árboles de clasificación que pueda generar un mejor poder predictivo. Los datos que estoy tratando tienen factores para las variables explicativas y explicadas. Recuerdo haber encontrado bosques aleatorios y redes neuronales en este contexto, aunque nunca los probé antes, ¿hay otro buen candidato para …

4
¿Por qué los investigadores usan la validación cruzada 10 veces en lugar de probar en un conjunto de validación?
He leído muchos trabajos de investigación sobre clasificación de sentimientos y temas relacionados. La mayoría de ellos utilizan validación cruzada 10 veces para entrenar y probar clasificadores. Eso significa que no se realiza ninguna prueba / validación por separado. ¿Porqué es eso? ¿Cuáles son las ventajas / desventajas de este …





Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.