Ciencia de los datos

Preguntas y respuestas para profesionales de la ciencia de datos, especialistas en aprendizaje automático y aquellos interesados ​​en aprender más sobre el campo

3
Computación paralela y distribuida
¿Cuál es (son) la (s) diferencia (s) entre computación paralela y distribuida? Cuando se trata de escalabilidad y eficiencia, es muy común ver soluciones que se ocupan de los cálculos en grupos de máquinas, y a veces se lo denomina procesamiento paralelo o procesamiento distribuido. De cierta manera, el cálculo …

1
propagación hacia atrás en CNN
Tengo la siguiente CNN: Comienzo con una imagen de entrada de tamaño 5x5 Luego aplico convolución usando kernel 2x2 y stride = 1, que produce un mapa de características de tamaño 4x4. Luego aplico 2x2 max-pooling con stride = 2, que reduce el mapa de características al tamaño 2x2. Luego …


5
Predicción de similitud de oraciones
Estoy tratando de resolver el siguiente problema: tengo un conjunto de oraciones como mi conjunto de datos, y quiero poder escribir una nueva oración y encontrar la oración con la que la nueva es más similar en el conjunto de datos. Un ejemplo se vería así: Nueva oración: " I …

2
Agrupación de visitantes únicos por useragent, ip, session_id
Dados los datos de acceso al sitio web en el formulario session_id, ip, user_agent, y opcionalmente la marca de tiempo, siguiendo las condiciones a continuación, ¿cómo agruparía mejor las sesiones en visitantes únicos? session_id: es una identificación dada a cada nuevo visitante. No caduca, sin embargo, si el usuario no …
15 clustering 


4
Árbol de decisión vs. KNN
¿En qué casos es mejor usar un árbol de decisión y otros casos un KNN? ¿Por qué usar uno de ellos en ciertos casos? ¿Y el otro en diferentes casos? (Al observar su funcionalidad, no el algoritmo) ¿Alguien tiene algunas explicaciones o referencias sobre esto?




2
¿Cómo funciona SelectKBest?
Estoy viendo este tutorial: https://www.dataquest.io/mission/75/improving-your-submission En la sección 8, que encuentra las mejores características, muestra el siguiente código. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # …


1
PyTorch vs. Tensorflow ansioso
Google recientemente incluyó en las construcciones nocturnas de tensorflow su modo Eager , una API imprescindible para acceder a las capacidades de cálculo de tensorflow. ¿Cómo se compara el tensorflow ansioso con PyTorch? Algunos aspectos que podrían afectar la comparación podrían ser: Ventajas y desventajas de ansioso debido a su …



Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.