Preguntas etiquetadas con scikit-learn

scikit-learn es una biblioteca de aprendizaje automático para Python que proporciona herramientas simples y eficientes para el análisis de datos y la minería de datos, con un enfoque en el aprendizaje automático. Es accesible para todos y reutilizable en varios contextos. Está construido sobre NumPy y SciPy. El proyecto es de código abierto y utilizable comercialmente (licencia BSD).

8
Se pasó una columna-vector y cuando se esperaba una matriz 1d
Necesito encajar RandomForestRegressordesde sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Este código siempre funcionó hasta que hice algún preprocesamiento de datos ( train_y). El mensaje de error dice: DataConversionWarning: Se pasó una columna-vector y cuando se esperaba una matriz 1d. Cambie la forma de y a …


13
ImportError al importar desde sklearn: no se puede importar el nombre check_build
Recibo el siguiente error al intentar importar desde sklearn: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build Estoy usando Python 2.7, scipy-0.12.0b1 superpack, …

2
¿Cómo funciona el parámetro class_weight en scikit-learn?
Tengo muchos problemas para entender cómo funciona el class_weightparámetro de Regresión logística de scikit-learn. La situación Quiero usar la regresión logística para hacer una clasificación binaria en un conjunto de datos muy desequilibrado. Las clases están etiquetadas como 0 (negativo) y 1 (positivo) y los datos observados están en una …






11
sklearn: se encontraron matrices con números inconsistentes de muestras al llamar a LinearRegression.fit ()
Solo intento hacer una regresión lineal simple, pero este error me desconcierta por: regr = LinearRegression() regr.fit(df2.iloc[1:1000, 5].values, df2.iloc[1:1000, 2].values) que produce: ValueError: Found arrays with inconsistent numbers of samples: [ 1 999] Estas selecciones deben tener las mismas dimensiones y deben ser matrices numerosas, entonces, ¿qué me estoy perdiendo?
102 scikit-learn 


3
RandomForestClassifier vs ExtraTreesClassifier en scikit learn
¿Alguien puede explicar la diferencia entre RandomForestClassifier y ExtraTreesClassifier en scikit learn? He pasado bastante tiempo leyendo el periódico: P. Geurts, D. Ernst. Y L. Wehenkel, "Árboles extremadamente aleatorios", Machine Learning, 63 (1), 3-42, 2006 Parece que estas son la diferencia para ET: 1) Al elegir variables en una división, …

5
Parámetro "estratificar" del método "train_test_split" (scikit Learn)
Estoy intentando usar el train_test_splitpaquete scikit Learn, pero tengo problemas con el parámetro stratify. A continuación está el código: from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.target cross_validation.train_test_split(X,y,stratify=y) Sin embargo, sigo teniendo el siguiente problema: raise TypeError("Invalid parameters passed: %s" % str(options)) TypeError: Invalid parameters passed: {'stratify': …


7
Tren estratificado / Test-split en scikit-learn
Necesito dividir mis datos en un conjunto de entrenamiento (75%) y un conjunto de prueba (25%). Actualmente hago eso con el siguiente código: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) Sin embargo, me gustaría estratificar mi conjunto de datos de entrenamiento. ¿Cómo puedo hacer eso? He estado investigando el StratifiedKFoldmétodo, …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.