Preguntas etiquetadas con classification

La clasificación estadística es el problema de identificar la subpoblación a la que pertenecen las nuevas observaciones, donde se desconoce la identidad de la subpoblación, sobre la base de un conjunto de entrenamiento de datos que contienen observaciones cuya subpoblación es conocida. Por lo tanto, estas clasificaciones mostrarán un comportamiento variable que puede ser estudiado por las estadísticas.



4
Clasificación con datos altos y gordos
Necesito entrenar un clasificador lineal en mi computadora portátil con cientos de miles de puntos de datos y alrededor de diez mil características. ¿Cuáles son mis opciones? ¿Cuál es el estado del arte para este tipo de problema? Parece que el descenso de gradiente estocástico es una dirección prometedora, y …

2
Un número creciente de características da como resultado una caída de precisión, pero un aumento de prec / recuperación
Soy nuevo en Machine Learning. En este momento estoy usando un clasificador Naive Bayes (NB) para clasificar textos pequeños en 3 clases como positivos, negativos o neutros, usando NLTK y python. Después de realizar algunas pruebas, con un conjunto de datos compuesto por 300,000 instancias (16,924 positivas 7,477 negativas y …


4
Similitud estadística de series temporales.
Supongamos que uno tiene una serie de tiempo a partir de la cual se pueden tomar varias medidas, como período, máximo, mínimo, promedio, etc. y luego usarlas para crear una onda sinusoidal modelo con los mismos atributos, ¿hay algún enfoque estadístico que se pueda usar que pueda cuantificar? ¿Cuán cerca …



3
Para los clasificadores lineales, ¿los coeficientes más grandes implican características más importantes?
Soy un ingeniero de software que trabaja en aprendizaje automático. Según tengo entendido, la regresión lineal (como OLS) y la clasificación lineal (como la regresión logística y SVM) hacen una predicción basada en un producto interno entre los coeficientes entrenados y las variables de característica :w⃗ w→\vec{w}x⃗ x→\vec{x} y^=f(w⃗ ⋅x⃗ …

2
¿Qué medida de error de entrenamiento reportar para bosques aleatorios?
Actualmente estoy ajustando bosques aleatorios para un problema de clasificación usando el randomForestpaquete en R, y no estoy seguro de cómo informar un error de entrenamiento para estos modelos. Mi error de entrenamiento es cercano al 0% cuando lo calculo usando predicciones que obtengo con el comando: predict(model, data=X_train) ¿Dónde …





3
¿Cómo hacer un aumento de datos y una división de validación de trenes?
Estoy haciendo clasificación de imágenes usando el aprendizaje automático. Supongamos que tengo algunos datos de entrenamiento (imágenes) y los dividiré en conjuntos de entrenamiento y validación. Y también quiero aumentar los datos (producir nuevas imágenes de las originales) mediante rotaciones aleatorias e inyección de ruido. El aumento se realiza sin …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.