Preguntas etiquetadas con scikit-learn

scikit-learn es una biblioteca de aprendizaje automático para Python que proporciona herramientas simples y eficientes para el análisis de datos y la minería de datos, con un enfoque en el aprendizaje automático. Es accesible para todos y reutilizable en varios contextos. Está construido sobre NumPy y SciPy. El proyecto es de código abierto y utilizable comercialmente (licencia BSD).

20
Etiqueta de codificación en varias columnas en scikit-learn
Estoy tratando de usar scikit-learn LabelEncoderpara codificar pandas DataFramede etiquetas de cadena. Como el marco de datos tiene muchas (50+) columnas, quiero evitar crear un LabelEncoderobjeto para cada columna; Prefiero tener un solo LabelEncoderobjeto grande que funcione en todas mis columnas de datos. Tirar todo el DataFrameen LabelEncodercrea el siguiente …


6
Guardar clasificador en disco en scikit-learn
¿Cómo puedo guardar una capacitados Bayes ingenuo clasificador de disco y utilizarlo para predecir datos? Tengo el siguiente programa de muestra del sitio web scikit-learn: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" …

15
ImportError: ningún módulo llamado sklearn.cross_validation
Estoy usando python 2.7 en Ubuntu 14.04. Instalé scikit-learn, numpy y matplotlib con estos comandos: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython Pero cuando importo estos paquetes: from sklearn.cross_validation import train_test_split Me devuelve este error: ImportError: No module named sklearn.cross_validation ¿Lo que necesito …









13
sklearn error ValueError: la entrada contiene NaN, infinito o un valor demasiado grande para dtype ('float64')
Estoy usando sklearn y tengo un problema con la propagación de afinidad. He construido una matriz de entrada y sigo recibiendo el siguiente error. ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). he corrido np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True Intenté usar mat[np.isfinite(mat) == …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.