Preguntas etiquetadas con feature-selection

Métodos y principios para seleccionar un subconjunto de atributos para usar en modelos adicionales

2
¿Está realmente bien realizar una selección de funciones sin supervisión antes de la validación cruzada?
En Los elementos del aprendizaje estadístico , he encontrado la siguiente declaración: Hay una calificación: los pasos iniciales de detección no supervisada se pueden realizar antes de dejar muestras. Por ejemplo, podríamos seleccionar los 1000 predictores con la mayor varianza en las 50 muestras, antes de comenzar la validación cruzada. …


6
Cómo preparar / construir características para la detección de anomalías (datos de seguridad de red)
Mi objetivo es analizar los registros de red (p. Ej., Apache, syslog, auditoría de seguridad de Active Directory, etc.) utilizando la detección de agrupamiento / anomalías para fines de detección de intrusos. De los registros tengo muchos campos de texto como dirección IP, nombre de usuario, nombre de host, puerto …

4
¿Lazar el orden de un retraso?
Supongamos que tengo datos longitudinales de la forma (Tengo múltiples observaciones, esta es solo la forma de una sola). Estoy interesado en restricciones en . Una sin restricciones es equivalente a tomar Y_j = \ alpha_j + \ sum _ {\ ell = 1} ^ {j - 1} \ phi …

1
¿Cómo comparar los eventos observados con los esperados?
Supongamos que tengo una muestra de frecuencias de 4 eventos posibles: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 y tengo las probabilidades esperadas de que ocurran mis eventos: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Con la suma de las …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
Prueba de permutación aleatoria para la selección de características
Estoy confundido sobre el análisis de permutación para la selección de características en un contexto de regresión logística. ¿Podría proporcionar una explicación clara de la prueba de permutación aleatoria y cómo se aplica a la selección de características? Posiblemente con algoritmo exacto y ejemplos. Finalmente, ¿cómo se compara con otros …

4
¿Cómo llevar a cabo múltiples pruebas de chi-cuadrado post-hoc en una mesa de 2 X 3?
Mi conjunto de datos está compuesto por la mortalidad total o la supervivencia de un organismo en tres tipos de sitios, costero, medio canal y en alta mar. Los números en la tabla a continuación representan el número de sitios. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 …



3
Calcular el mejor subconjunto de predictores para regresión lineal
Para la selección de predictores en regresión lineal multivariada con predictores adecuados, ¿qué métodos están disponibles para encontrar un subconjunto 'óptimo' de los predictores sin probar explícitamente todos los subconjuntos de ? En 'Análisis de supervivencia aplicada', Hosmer y Lemeshow hacen referencia al método de Kuk, pero no puedo encontrar …




1
En la regresión múltiple, ¿por qué las interacciones se modelan como productos, y no otra cosa, de los predictores?
Considere la regresión lineal múltiple. Esta pregunta puede ser engañosamente simple, pero estoy tratando de entender intuitivamente por qué, por ejemplo, si tengo predictores X1 y X2, X1 * X2 puede capturar adecuadamente las interacciones entre estos predictores. Sé que los términos de interacción se modelan como productos, solo porque …

2
Selección de características en un modelo lineal generalizado jerárquico bayesiano
Estoy buscando estimar un GLM jerárquico pero con selección de características para determinar qué covariables son relevantes a nivel de población para incluir. Supongamos que tengo grupos con observaciones y posibles covariables. Es decir, tengo una matriz de diseño de covariables , resultados \ boldsymbol {y} _ {(N \ cdot …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.