Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo


3
Pandas Dataframe a DMatrix
Estoy tratando de ejecutar xgboost en scikit learn. Y solo uso Pandas para cargar datos en el marco de datos. ¿Cómo se supone que debo usar pandas df con xgboost? Estoy confundido por la rutina DMatrix requerida para ejecutar xgboost algo.

3
¿Cómo utilizar LeakyRelu como función de activación en la secuencia DNN en keras? ¿Cuándo funciona mejor que Relu?
¿Cómo se usa LeakyRelu como función de activación en secuencia DNN en keras? Si quiero escribir algo similar a: model = Sequential() model.add(Dense(90, activation='LeakyRelu')) ¿Cuál es la solución? ¿Poner LeakyRelu similar a Relu? La segunda pregunta es: ¿cuál es la mejor configuración general para ajustar los parámetros de LeakyRelu? ¿Cuándo …


2
¿Por qué no se utilizan algoritmos genéticos para optimizar las redes neuronales?
Según tengo entendido, los algoritmos genéticos son herramientas poderosas para la optimización de objetivos múltiples. Además, la formación de redes neuronales (especialmente las profundas) es difícil y tiene muchos problemas (funciones de costos no convexas: mínimos locales, gradientes de desaparición y explosión, etc.). También considero que capacitar conceptualmente un NN …



1
Cuántas características para muestrear usando bosques aleatorios
La página de Wikipedia que cita "Los elementos del aprendizaje estadístico" dice: Por lo general, para un problema de clasificación con características , ⌊ √pagpagp características p ⌋se utilizan en cada división.⌊ p-√⌋⌊pag⌋\lfloor \sqrt{p}\rfloor Entiendo que esta es una conjetura bastante buena y probablemente fue confirmada por evidencia empírica, pero …

1
XGBRegressor vs xgboost.train gran diferencia de velocidad?
Si entreno a mi modelo con el siguiente código: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) termina en aproximadamente 1 minuto. Si entreno mi modelo usando el método …

1
Mapa de calor en un mapa en Python
Mode Analytics tiene una buena función de mapa de calor ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Pero no es propicio para comparar mapas (solo uno por informe). Lo que sí permiten es que los datos se extraigan fácilmente en un cuaderno de python envuelto. Y luego cualquier imagen en Python se puede agregar …






Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.