Preguntas etiquetadas con machine-learning

Los algoritmos de aprendizaje automático crean un modelo de los datos de entrenamiento. El término "aprendizaje automático" está vagamente definido; incluye lo que también se llama aprendizaje estadístico, aprendizaje de refuerzo, aprendizaje no supervisado, etc. AGREGUE SIEMPRE UNA ETIQUETA MÁS ESPECÍFICA.

2
¿Cómo elegir la capacitación, la validación cruzada y los tamaños de los conjuntos de prueba para datos de tamaño de muestra pequeño?
Suponga que tengo un tamaño de muestra pequeño, por ejemplo, N = 100 y dos clases. ¿Cómo debo elegir la capacitación, la validación cruzada y los tamaños de los conjuntos de prueba para el aprendizaje automático? Yo elegiría intuitivamente Tamaño del set de entrenamiento como 50 Conjunto de validación cruzada …

2
¿Cuáles son buenas métricas para evaluar la calidad de un ajuste de PCA para seleccionar el número de componentes?
¿Cuál es una buena métrica para evaluar la calidad del análisis de componentes principales (PCA)? Realicé este algoritmo en un conjunto de datos. Mi objetivo era reducir la cantidad de funciones (la información era muy redundante). Sé que el porcentaje de variación mantenido es un buen indicador de la cantidad …

1
Interpretación del área bajo la curva PR
Actualmente estoy comparando tres métodos y tengo la precisión, auROC y auPR como métricas. Y tengo los siguientes resultados: Método A - acc: 0.75, auROC: 0.75, auPR: 0.45 Método B - acc: 0.65, auROC: 0.55, auPR: 0.40 Método C - acc: 0.55, auROC: 0.70, auPR: 0.65 Tengo una buena comprensión …



1
Comparación de CPH, modelo de tiempo de falla acelerado o redes neuronales para análisis de supervivencia
Soy nuevo en el análisis de supervivencia y recientemente aprendí que hay diferentes maneras de hacerlo dado un determinado objetivo. Estoy interesado en la implementación real y la adecuación de estos métodos. Se me presentaron los modelos tradicionales de riesgo proporcional de Cox , tiempo de falla acelerado y redes …


1
¿En qué implementaciones se requiere la escala variable de los árboles de decisión y la normalización (ajuste) de las variables (características)?
En muchos algoritmos de aprendizaje automático, el escalado de características (también conocido como escalado variable, normalización) es un paso de preprocesamiento común Wikipedia - Escalado de características - esta pregunta estaba cerrada Pregunta # 41704 - ¿Cómo y por qué funcionan la normalización y el escalado de características? Tengo dos …

6
Modelos flexibles e inflexibles en el aprendizaje automático.
Encontré una pregunta simple sobre la comparación de modelos flexibles (es decir, splines) frente a modelos inflexibles (por ejemplo, regresión lineal) en diferentes escenarios. La pregunta es: En general, ¿esperamos que el rendimiento de un método de aprendizaje estadístico flexible funcione mejor o peor que un método inflexible cuando: ¿El …


3
Cómo obtener el intervalo de confianza en el cambio de r-cuadrado poblacional
Por un simple ejemplo, suponga que hay dos modelos de regresión lineal Modelo 1 tiene tres predictores, x1a, x2b, yx2c El modelo 2 tiene tres predictores del modelo 1 y dos predictores adicionales x2ayx2b Hay una ecuación de regresión poblacional donde la varianza poblacional explicada es para el Modelo 1 …

1
¿Cómo incorporo un valor atípico innovador en la observación 48 en mi modelo ARIMA?
Estoy trabajando en un conjunto de datos. Después de usar algunas técnicas de identificación de modelos, obtuve un modelo ARIMA (0,2,1). Utilicé la detectIOfunción en el paquete TSAen R para detectar un valor atípico innovador (IO) en la observación número 48 de mi conjunto de datos original. ¿Cómo incorporo este …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 



1
¿Se puede entrenar un modelo de P (Y | X) a través del descenso de gradiente estocástico a partir de muestras de P (X) sin iid y muestras de P (Y | X)?
Cuando se entrena un modelo parametrizado (por ejemplo, para maximizar la probabilidad) a través del descenso de gradiente estocástico en algún conjunto de datos, se supone comúnmente que las muestras de entrenamiento se extraen de la distribución de datos de entrenamiento. Entonces, si el objetivo es modelar una distribución conjunta …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.