Preguntas etiquetadas con classification

La clasificación estadística es el problema de identificar la subpoblación a la que pertenecen las nuevas observaciones, donde se desconoce la identidad de la subpoblación, sobre la base de un conjunto de entrenamiento de datos que contienen observaciones cuya subpoblación es conocida. Por lo tanto, estas clasificaciones mostrarán un comportamiento variable que puede ser estudiado por las estadísticas.



3
Aplique incrustaciones de palabras en todo el documento para obtener un vector de características
¿Cómo uso una incrustación de palabras para asignar un documento a un vector de características, adecuado para su uso con aprendizaje supervisado? Una incrustación de palabras asigna cada palabra www a un vector , donde es un número no demasiado grande (por ejemplo, 500). Las incrustaciones de palabras populares incluyen …

6
Mejora la clasificación con muchas variables categóricas
Estoy trabajando en un conjunto de datos con más de 200,000 muestras y aproximadamente 50 características por muestra: 10 variables continuas y las otras ~ 40 son variables categóricas (países, idiomas, campos científicos, etc.). Para estas variables categóricas, tiene por ejemplo 150 países diferentes, 50 idiomas, 50 campos científicos, etc. …

3
SVM, sobreajuste, maldición de dimensionalidad
Mi conjunto de datos es pequeño (120 muestras), sin embargo, el número de características es grande varía de (1000-200,000). Aunque estoy haciendo una selección de características para elegir un subconjunto de características, aún podría sobreajustar. Mi primera pregunta es, ¿cómo maneja SVM el sobreajuste, si es que lo hace? En …


3
PCA y la división tren / prueba
Tengo un conjunto de datos para el que tengo múltiples conjuntos de etiquetas binarias. Para cada conjunto de etiquetas, entreno a un clasificador, evaluándolo por validación cruzada. Quiero reducir la dimensionalidad utilizando el análisis de componentes principales (PCA). Mi pregunta es: ¿Es posible hacer el PCA una vez para todo …




3
Cómo interpretar la disminución media de precisión y la disminución media de GINI en modelos de bosque aleatorio
Tengo algunas dificultades para comprender cómo interpretar la salida de importancia variable del paquete Random Forest. La disminución media en la precisión generalmente se describe como "la disminución en la precisión del modelo al permutar los valores en cada característica". ¿Es esta una declaración sobre la característica en su conjunto …

3

3
¿Qué se entiende por "alumno débil"?
¿Alguien puede decirme qué significa la frase 'estudiante débil'? ¿Se supone que es una hipótesis débil? Estoy confundido acerca de la relación entre un alumno débil y un clasificador débil. ¿Ambos son iguales o hay alguna diferencia? En el algoritmo AdaBoost, T=10. ¿Qué se entiende por eso? ¿Por qué seleccionamos …


6
Clasificación estadística del texto.
Soy un programador sin antecedentes estadísticos, y actualmente estoy buscando diferentes métodos de clasificación para una gran cantidad de documentos diferentes que quiero clasificar en categorías predefinidas. He estado leyendo sobre kNN, SVM y NN. Sin embargo, tengo algunos problemas para comenzar. ¿Qué recursos me recomiendan? Conozco bastante bien el …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.