Preguntas etiquetadas con feature-selection

Métodos y principios para seleccionar un subconjunto de atributos para usar en modelos adicionales





4
¿Hay alguna manera de usar la validación cruzada para hacer la selección de variables / características en R?
Tengo un conjunto de datos con aproximadamente 70 variables que me gustaría reducir. Lo que estoy buscando hacer es usar CV para encontrar las variables más útiles de la siguiente manera. 1) Seleccione aleatoriamente digamos 20 variables. 2) Use stepwise/ LASSO/ lars/ etc para elegir las variables más importantes. 3) …

4
Mejora de la clasificación SVM de diabetes
Estoy usando SVM para predecir la diabetes. Estoy usando el conjunto de datos BRFSS para este propósito. El conjunto de datos tiene las dimensiones de y está sesgado. El porcentaje de s en la variable objetivo es mientras que los s constituyen el restante .432607×136432607×136432607 \times 136Y11%11%11\%N89%89%89\% Estoy utilizando solamente …


1
¿Cómo cuantificar la redundancia de características?
Tengo tres características que utilizo para resolver un problema de clasificación. Originalmente, estas características producían valores booleanos, por lo que pude evaluar su redundancia al observar cuánto se superponen los conjuntos de clasificaciones positivas y negativas. Ahora he ampliado las funciones para producir valores reales (puntajes) en su lugar, y …


3
Identificación de características filtradas después de la selección de características con scikit learn
Aquí está mi Código para el método de selección de características en Python: from sklearn.svm import LinearSVC from sklearn.datasets import load_iris iris = load_iris() X, y = iris.data, iris.target X.shape (150, 4) X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y) X_new.shape (150, 3) Pero después de obtener una nueva X (variable dependiente …


3
¿Pueden las variables independientes con baja correlación con la variable dependiente ser predictores significativos?
Tengo ocho variables independientes y una dependiente. He ejecutado una matriz de correlación, y 5 de ellos tienen una baja correlación con el DV. Luego ejecuté una regresión múltiple por pasos para ver si alguno / todos los IV pueden predecir el DV. La regresión mostró que solo dos IV …




Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.