Preguntas etiquetadas con scikit-learn

Una biblioteca de aprendizaje automático para Python. Use esta etiqueta para cualquier pregunta sobre el tema que (a) involucre scikit-learn como parte crítica de la pregunta o respuesta esperada, y (b) no se trata solo de cómo usar scikit-learn.

1
¿Cómo dividir el conjunto de datos para la validación cruzada, la curva de aprendizaje y la evaluación final?
¿Cuál es una estrategia adecuada para dividir el conjunto de datos? Pido retroalimentación en el enfoque siguiente (no en los parámetros individuales tales como test_sizeo n_iter, pero si utilicé X, y, X_train, y_train, X_test, y y_testde manera adecuada y si la secuencia tiene sentido): (ampliando este ejemplo de la documentación …

1
Codificación de uno solo vs simulado en Scikit-learn
Hay dos formas diferentes de codificar variables categóricas. Digamos, una variable categórica tiene n valores. La codificación única lo convierte en n variables, mientras que la codificación ficticia lo convierte en n-1 variables. Si tenemos k variables categóricas, cada una de las cuales tiene n valores. Una codificación activa termina …


2
Pandas / Statsmodel / Scikit-learn
¿Son Pandas, Statsmodels y Scikit-learn diferentes implementaciones de aprendizaje automático / operaciones estadísticas, o son complementarias entre sí? ¿Cuál de estos tiene la funcionalidad más completa? ¿Cuál se desarrolla y / o apoya activamente? Tengo que implementar la regresión logística. ¿Alguna sugerencia sobre cuál de estos debo usar?




1
¿Pueden los grados de libertad ser un número no entero?
Cuando uso GAM, me da un DF residual de 26.626.626.6 (última línea en el código). Qué significa eso? Yendo más allá del ejemplo de GAM, en general, ¿puede el número de grados de libertad ser un número no entero? > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 



2
¿Por qué el Lik scikit-learn de Python no funciona correctamente y cómo calcula LDA a través de SVD?
Estaba utilizando el Análisis discriminante lineal (LDA) de la scikit-learnbiblioteca de aprendizaje automático (Python) para la reducción de la dimensionalidad y tenía un poco de curiosidad por los resultados. Ahora me pregunto qué scikit-learnestá haciendo la LDA para que los resultados se vean diferentes de, por ejemplo, un enfoque manual …



2
PCA en numpy y sklearn produce resultados diferentes
¿Estoy malinterpretando algo? Este es mi codigo usando sklearn import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], [1,12756,5.52], [1.524,6787,3.94], ]) pca.fit_transform(x) Salida: array([[ -4.25324997e+03, -8.41288672e-01, …

2
Cómo usar las funciones de validación cruzada de scikit-learn en clasificadores de etiquetas múltiples
Estoy probando diferentes clasificadores en un conjunto de datos donde hay 5 clases y cada instancia puede pertenecer a una o más de estas clases, así que estoy usando los clasificadores de etiquetas múltiples de scikit-learn, específicamente sklearn.multiclass.OneVsRestClassifier. Ahora quiero realizar una validación cruzada usando sklearn.cross_validation.StratifiedKFold. Esto produce el siguiente …

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.