Preguntas etiquetadas con classification

La clasificación estadística es el problema de identificar la subpoblación a la que pertenecen las nuevas observaciones, donde se desconoce la identidad de la subpoblación, sobre la base de un conjunto de entrenamiento de datos que contienen observaciones cuya subpoblación es conocida. Por lo tanto, estas clasificaciones mostrarán un comportamiento variable que puede ser estudiado por las estadísticas.

1
Clasificación con un predictor dominante
Tengo un problema de clasificación ( clase ), con del orden de 100 predictores con valores reales, uno de los cuales parece tener mucho más poder explicativo que cualquiera de los otros. Me gustaría profundizar en los efectos de las otras variables. Sin embargo, las técnicas estándar de aprendizaje automático …



4
¿Cómo llevar a cabo múltiples pruebas de chi-cuadrado post-hoc en una mesa de 2 X 3?
Mi conjunto de datos está compuesto por la mortalidad total o la supervivencia de un organismo en tres tipos de sitios, costero, medio canal y en alta mar. Los números en la tabla a continuación representan el número de sitios. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 …


2
Calcular curva ROC para datos
Entonces, tengo 16 ensayos en los que estoy tratando de autenticar a una persona de un rasgo biométrico usando Hamming Distance. Mi umbral está establecido en 3.5. Mis datos están a continuación y solo la prueba 1 es un verdadero positivo: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 


1
Técnicas de categorización / segmentación
Primero, permítanme decir que estoy un poco fuera de mi alcance aquí, así que si esta pregunta necesita ser reformulada o cerrada como un duplicado, háganmelo saber. Puede ser simplemente que no tengo el vocabulario adecuado para expresar mi pregunta. Estoy trabajando en una tarea de procesamiento de imágenes en …

2
Pérdida de bisagra con clasificador uno contra todos
Actualmente estoy mirando la forma primaria sin restricciones del clasificador uno contra todos ∑i=1NI∑k=1,k≠yiNKL(1+wk⋅xi−wyi⋅xi)∑i=1NI∑k=1,k≠yiNKL(1+wk⋅xi−wyi⋅xi)\sum\limits_{i=1}^{N_I} \sum\limits_{k=1,\atop k \neq y_i}^{N_K} L(1+ \mathbf{w_k}\cdot\mathbf{x_i}-\mathbf{w_{y_i}}\cdot\mathbf{x_i}) dónde NININ_I es el número de instancias, es el número de clases, es el número de características, es una matriz de datos , es un vector de etiquetas de clase, …



2
¿Es Random Forest una buena opción para la clasificación de datos desequilibrados? [cerrado]
Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 3 años . A pesar del parecido y otros enfoques de variabilidad de datos cada …

4
Coeficiente de correlación de Matthews con multiclase
Coeficiente de correlación de Matthews (MCCMCC\textrm{MCC}) es una medida para medir la calidad de una clasificación binaria ([Wikipedia] [1]). MCCMCC\textrm{MCC}La formulación se da para la clasificación binaria utilizando verdaderos positivos (TPTPTP), falsos positivos (FPFPFP), falsos negativos (FNFNFN) y verdaderos negativos (TNTNTN) valores como se indica a continuación: MCC=TP×TN−FP×FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√MCC=TP×TN−FP×FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)\textrm {MCC} = …

3
KNN: 1 vecino más cercano
Mi pregunta es sobre el clasificador vecino más cercano y sobre una declaración hecha en el excelente libro The Elements of Statistical Learning, de Hastie, Tibshirani y Friedman. La declaración es (p. 465, sección 13.3): "Debido a que usa solo el punto de entrenamiento más cercano al punto de consulta, …

1
Análisis discriminante lineal para
Estoy estudiando 'Introducción al aprendizaje estadístico' de James, Witten, Hastie, Tibshirani. En la página 139 de su libro, comenzaron introduciendo el Teorema de Bayes . no es una constante matemática, pero denota la probabilidad previa. Nada es extraño en esta ecuación.pk(X)=P(Y=k|X=x)=πkfk(x)∑kl=1πlfl(x)pk(X)=P(Y=k|X=x)=πkfk(x)∑l=1kπlfl(x)p_k(X)=P(Y=k|X=x) = \dfrac{\pi_kf_k(x)}{\sum_{l=1}^k \pi_l f_l(x)}ππ\pi El libro afirma que quiere …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.