Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo

10
¿Qué son las capas deconvolucionales?
Recientemente leí Redes totalmente convolucionales para la segmentación semántica por Jonathan Long, Evan Shelhamer, Trevor Darrell. No entiendo qué hacen las "capas deconvolucionales" / cómo funcionan. La parte relevante es 3.3. El muestreo ascendente es una convolución hacia atrás Otra forma de conectar salidas gruesas a píxeles densos es la …

30
Conjuntos de datos disponibles públicamente
Uno de los problemas comunes en la ciencia de datos es reunir datos de varias fuentes en un formato de alguna manera limpio (semi-estructurado) y combinar métricas de varias fuentes para hacer un análisis de nivel superior. Al observar el esfuerzo de otras personas, especialmente otras preguntas en este sitio, …

13
Agrupación de K-medias para datos numéricos y categóricos mixtos
Mi conjunto de datos contiene varios atributos numéricos y uno categórico. Decir NumericAttr1, NumericAttr2, ..., NumericAttrN, CategoricalAttr, donde CategoricalAttrtiene uno de los tres valores posibles: CategoricalAttrValue1, CategoricalAttrValue2o CategoricalAttrValue3. Estoy usando la implementación predeterminada del algoritmo de agrupación k-means para Octave https://blog.west.uni-koblenz.de/2012-07-14/a-working-k-means-code-for-octave/ . Funciona solo con datos numéricos. Entonces mi pregunta: …




5
La función de error de entropía cruzada en redes neuronales
En MNIST For ML Beginners definen la entropía cruzada como Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyiy_i es el valor de probabilidad pronosticado para la clase e es la probabilidad real para esa clase.y ′ iiiiy′iyi′y_i' Pregunta 1 ¿No es un problema que (en ) podría ser 0? …

8
¿Diferencia entre fit y fit_transform en modelos scikit_learn?
Soy novato en la ciencia de datos y no entiendo la diferencia entre fity fit_transformmétodos en scikit-learn. ¿Alguien puede simplemente explicar por qué podríamos necesitar transformar los datos? ¿Qué significa ajustar el modelo en los datos de entrenamiento y transformarlos en datos de prueba? ¿Significa, por ejemplo, convertir variables categóricas …


15
Python vs R para aprendizaje automático
Estoy empezando a desarrollar una aplicación de aprendizaje automático para fines académicos. Actualmente estoy usando R y entrenándome en ello. Sin embargo, en muchos lugares, he visto personas que usan Python . ¿Qué utilizan las personas en la academia y la industria, y cuál es la recomendación?


6
¿Cuándo usar GRU sobre LSTM?
La diferencia clave entre un GRU y un LSTM es que un GRU tiene dos compuertas ( restablecer y actualizar compuertas) mientras que un LSTM tiene tres compuertas (es decir , compuertas de entrada , salida y olvido ). ¿Por qué hacemos uso de GRU cuando claramente tenemos más control …

12
¿Qué tan grande es el big data?
Mucha gente usa el término big data de una manera bastante comercial , como un medio de indicar que grandes conjuntos de datos están involucrados en el cálculo y, por lo tanto, las posibles soluciones deben tener un buen rendimiento. Por supuesto, big data siempre lleva términos asociados, como escalabilidad …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.