Preguntas etiquetadas con scikit-learn

Scikit-learn es un módulo de Python que comprende una herramienta simple y eficiente para el aprendizaje automático, la minería de datos y el análisis de datos. Está construido en NumPy, SciPy y matplotlib. Se distribuye bajo la licencia BSD de 3 cláusulas.

3
Relación entre convolución en matemáticas y CNN
He leído la explicación de la convolución y la entiendo hasta cierto punto. ¿Alguien puede ayudarme a entender cómo esta operación se relaciona con la convolución en redes neuronales convolucionales? ¿Es el filtro como una función gque aplica peso?
10 machine-learning  neural-network  deep-learning  cnn  convolution  machine-learning  ensemble-modeling  machine-learning  classification  data-mining  clustering  machine-learning  feature-selection  convnet  pandas  graphs  ipython  machine-learning  apache-spark  multiclass-classification  naive-bayes-classifier  multilabel-classification  machine-learning  data-mining  dataset  data-cleaning  data  machine-learning  data-mining  statistics  correlation  machine-learning  data-mining  dataset  data-cleaning  data  beginner  career  python  r  visualization  machine-learning  data-mining  nlp  stanford-nlp  dataset  linear-regression  time-series  correlation  anomaly-detection  ensemble-modeling  data-mining  machine-learning  python  data-mining  recommender-system  machine-learning  cross-validation  model-selection  scoring  prediction  sequential-pattern-mining  categorical-data  python  tensorflow  image-recognition  statistics  machine-learning  data-mining  predictive-modeling  data-cleaning  preprocessing  classification  deep-learning  tensorflow  machine-learning  algorithms  data  keras  categorical-data  reference-request  loss-function  classification  logistic-regression  apache-spark  prediction  naive-bayes-classifier  beginner  nlp  word2vec  vector-space-models  scikit-learn  decision-trees  data  programming 

3


1
Datos desequilibrados que causan una clasificación errónea en el conjunto de datos multiclase
Estoy trabajando en la clasificación de texto donde tengo 39 categorías / clases y 8,5 millones de registros. (En el futuro, los datos y las categorías aumentarán). La estructura o el formato de mis datos es el siguiente. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge …

4
Interpretación del árbol de decisiones en el contexto de las características importantes
Estoy tratando de entender cómo entender completamente el proceso de decisión de un modelo de clasificación de árbol de decisión construido con sklearn. Los dos aspectos principales que estoy viendo son una representación gráfica del árbol y la lista de características importantes. Lo que no entiendo es cómo se determina …

3
Exportar pesos (fórmula) de Random Forest Regressor en Scikit-Learn
Entrené un modelo de predicción con Scikit Learn en Python (Random Forest Regressor) y quiero extraer de alguna manera los pesos de cada característica para crear una herramienta de Excel para la predicción manual. Lo único que encontré es el model.feature_importances_pero no ayuda. ¿Hay alguna forma de lograrlo? def performRandomForest(X_train, …



1
¿Se puede usar la confianza de la etiqueta de entrenamiento para mejorar la precisión de la predicción?
Tengo datos de entrenamiento que están etiquetados con valores binarios. También he recopilado la confianza de cada una de estas etiquetas, es decir, 0,8 de confianza significaría que el 80% de los etiquetadores humanos están de acuerdo con esa etiqueta. ¿Es posible utilizar estos datos de confianza para mejorar la …


2
¿Por qué la regresión de Gradient Boosting predice valores negativos cuando no hay valores y negativos en mi conjunto de entrenamiento?
Como puedo aumentar el número de árboles en scikit aprender 's GradientBoostingRegressor, consigo predicciones más negativas, a pesar de que no hay valores negativos en mi entrenamiento o de prueba establecido. Tengo alrededor de 10 características, la mayoría de las cuales son binarias. Algunos de los parámetros que estaba ajustando …

3
Validación cruzada anidada y selección del mejor modelo de regresión: ¿es este el proceso SKLearn correcto?
Si entiendo correctamente, el CV anidado puede ayudarme a evaluar qué modelo y proceso de ajuste de hiperparámetro es mejor. El bucle interno ( GridSearchCV) encuentra los mejores hiperparámetros, y el bucle externo ( cross_val_score) evalúa el algoritmo de ajuste del hiperparámetro. Luego elijo qué combo de ajuste / modelo …

1
sklearn - problema de sobreajuste
Estoy buscando recomendaciones sobre el mejor camino para mi problema actual de aprendizaje automático El resumen del problema y lo que he hecho es el siguiente: Tengo más de 900 pruebas de datos de EEG, donde cada prueba dura 1 segundo. La verdad básica es conocida para cada uno y …
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.