Preguntas etiquetadas con feature-selection

Métodos y principios para seleccionar un subconjunto de atributos para usar en modelos adicionales

2
Selección de características con bosques aleatorios
Tengo un conjunto de datos con variables financieras en su mayoría (120 características, ejemplos de 4k) que en su mayoría están altamente correlacionadas y son muy ruidosas (indicadores técnicos, por ejemplo), por lo que me gustaría seleccionar un máximo de 20-30 para su uso posterior con entrenamiento modelo (clasificación binaria …


4
Minería de texto: ¿cómo agrupar textos (por ejemplo, artículos de noticias) con inteligencia artificial?
He construido algunas redes neuronales (MLP (completamente conectadas), Elman (recurrente)) para diferentes tareas, como jugar Pong, clasificar dígitos escritos a mano y otras cosas ... Además, intenté construir algunas primeras redes neuronales convolucionales, por ejemplo, para clasificar notas manuscritas de varios dígitos, pero soy completamente nuevo para analizar y agrupar …




3
Para los clasificadores lineales, ¿los coeficientes más grandes implican características más importantes?
Soy un ingeniero de software que trabaja en aprendizaje automático. Según tengo entendido, la regresión lineal (como OLS) y la clasificación lineal (como la regresión logística y SVM) hacen una predicción basada en un producto interno entre los coeficientes entrenados y las variables de característica :w⃗ w→\vec{w}x⃗ x→\vec{x} y^=f(w⃗ ⋅x⃗ …



1
¿Qué método de comparación múltiple usar para un modelo lmer: lsmeans o glht?
Estoy analizando un conjunto de datos utilizando un modelo de efectos mixtos con un efecto fijo (condición) y dos efectos aleatorios (participante debido al diseño del sujeto y al par). El modelo se ha generado con el lme4paquete: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). A continuación, realicé una prueba de razón de probabilidad de este …


2
¿Diferencia entre seleccionar entidades basadas en la "regresión F" y en los valores ?
¿Comparar características usando F-regressionlo mismo que correlacionar características con la etiqueta individualmente y observando el valor ?R2R2R^2 A menudo he visto a mis colegas usar una F regressionselección de funciones para su canal de aprendizaje automático de sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` Algunos, por favor, díganme: ¿por qué da los mismos resultados que …



1
GAM vs LOESS vs splines
Contexto : Quiero trazar una línea en un diagrama de dispersión que no aparece paramétrico, por lo tanto, estoy usando geom_smooth()en ggploten R. Devuelve automáticamente. geom_smooth: method="auto" and size of largest group is >=1000, so using gam with formula: y ~ s(x, bs = "cs"). Use 'method = x' to …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.