Ciencia de los datos

3

¿Cuál es (son) la (s) diferencia (s) entre computación paralela y distribuida? Cuando se trata de escalabilidad y eficiencia, es muy común ver soluciones que se ocupan de los cálculos en grupos de máquinas, y a veces se lo denomina procesamiento paralelo o procesamiento distribuido. De cierta manera, el cálculo …

15 definitions parallel distributed

1

propagación hacia atrás en CNN

Tengo la siguiente CNN: Comienzo con una imagen de entrada de tamaño 5x5 Luego aplico convolución usando kernel 2x2 y stride = 1, que produce un mapa de características de tamaño 4x4. Luego aplico 2x2 max-pooling con stride = 2, que reduce el mapa de características al tamaño 2x2. Luego …

15 machine-learning convnet backpropagation cnn kernel

1

¿Cuál es la ventaja de mantener el tamaño del lote con una potencia de 2?

Mientras entrena modelos en aprendizaje automático, ¿por qué a veces es ventajoso mantener el tamaño del lote a una potencia de 2? Pensé que sería mejor usar un tamaño que sea el más grande en la memoria / RAM de tu GPU. Esta respuesta afirma que para algunos paquetes, una …

15 machine-learning training

5

Predicción de similitud de oraciones

Estoy tratando de resolver el siguiente problema: tengo un conjunto de oraciones como mi conjunto de datos, y quiero poder escribir una nueva oración y encontrar la oración con la que la nueva es más similar en el conjunto de datos. Un ejemplo se vería así: Nueva oración: " I …

15 python nlp scikit-learn similarity text

2

Agrupación de visitantes únicos por useragent, ip, session_id

Dados los datos de acceso al sitio web en el formulario session_id, ip, user_agent, y opcionalmente la marca de tiempo, siguiendo las condiciones a continuación, ¿cómo agruparía mejor las sesiones en visitantes únicos? session_id: es una identificación dada a cada nuevo visitante. No caduca, sin embargo, si el usuario no …

15 clustering

6

Keras - Transferir aprendizaje - cambiar la forma del tensor de entrada

Esta publicación parece indicar que lo que quiero lograr no es posible. Sin embargo, no estoy convencido de esto: dado lo que ya he hecho, no veo por qué no puedo lograr lo que quiero hacer ... Tengo dos conjuntos de datos de imágenes donde uno tiene imágenes de forma …

15 keras

4

Árbol de decisión vs. KNN

¿En qué casos es mejor usar un árbol de decisión y otros casos un KNN? ¿Por qué usar uno de ellos en ciertos casos? ¿Y el otro en diferentes casos? (Al observar su funcionalidad, no el algoritmo) ¿Alguien tiene algunas explicaciones o referencias sobre esto?

15 machine-learning data-mining decision-trees

2

Ciencia de datos sin conocimiento de un tema específico, ¿vale la pena seguir como carrera? [cerrado]

Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que sea sobre el tema de Data Science Stack Exchange. Cerrado hace 5 años . Recientemente tuve una conversación con alguien y mencioné mi interés en el análisis de …

15 education beginner career

2

¿Por qué las variables de tren y datos de prueba se definen usando la letra mayúscula (en Python)?

Espero que esta pregunta sea la más adecuada en este sitio ... En Python, por lo general, el nombre de la clase se define utilizando la letra mayúscula como primer carácter, por ejemplo class Vehicle: ... Sin embargo, en el campo del aprendizaje automático, a menudo los datos de entrenamiento …

15 python dataset

4

¿Cómo escalar una matriz de enteros con signo para variar de 0 a 1?

Estoy usando Brain para entrenar una red neuronal en un conjunto de características que incluye valores positivos y negativos. Pero Brain requiere valores de entrada entre 0 y 1. ¿Cuál es la mejor manera de normalizar mis datos?

15 machine-learning neural-network feature-scaling normalization javascript

2

¿Cómo funciona SelectKBest?

Estoy viendo este tutorial: https://www.dataquest.io/mission/75/improving-your-submission En la sección 8, que encuentra las mejores características, muestra el siguiente código. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, k=5) selector.fit(titanic[predictors], titanic["Survived"]) # …

15 python scikit-learn

4

Las salidas de XGBoost tienden hacia los extremos

Actualmente estoy usando XGBoost para la predicción de riesgos, parece estar haciendo un buen trabajo en el departamento de clasificación binaria, pero los resultados de probabilidad están muy lejos, es decir, cambiar el valor de una característica en una observación en una cantidad muy pequeña puede hacer que la probabilidad …

15 machine-learning classification xgboost probability probability-calibration

1

PyTorch vs. Tensorflow ansioso

Google recientemente incluyó en las construcciones nocturnas de tensorflow su modo Eager , una API imprescindible para acceder a las capacidades de cálculo de tensorflow. ¿Cómo se compara el tensorflow ansioso con PyTorch? Algunos aspectos que podrían afectar la comparación podrían ser: Ventajas y desventajas de ansioso debido a su …

14 deep-learning tensorflow pytorch

3

¿Las GAN (redes de confrontación generativas) también son posibles para el texto?

¿Son las GAN (redes de confrontación generativas) buenas solo para imágenes, o podrían usarse también para texto? Como, entrenar a una red para generar textos significativos a partir de un resumen. UPD - citas del inventor de GAN Ian Goodfellow. Las GAN no se han aplicado a la PNL porque …

14 gan

4

¿Podemos generar grandes conjuntos de datos con redes generativas adversas

Estoy lidiando con un problema en el que no pude encontrar suficientes conjuntos de datos (imágenes) para alimentar mi red neuronal profunda para el entrenamiento. Me inspiró mucho el documento Generative Adversarial Text to Image Synthesis publicado por Scott Reed et al. sobre redes generativas adversas. Tenía curiosidad por saber …

14 deep-learning gan