Ciencia de los datos

2

Relu tiene 0 gradiente por definición, entonces ¿por qué desaparecer el gradiente no es un problema para x <0?

Por definición, Relu es max(0,f(x)). Luego de su gradiente se define como: 1 if x > 0 and 0 if x < 0. ¿No significa esto que el gradiente siempre es 0 (desaparece) cuando x <0? Entonces, ¿por qué decimos que Relu no sufre el problema de la desaparición del …

10 deep-learning

3

¿Cómo agrupar valores idénticos y contar su frecuencia en Python?

Novato a la analítica con Python, así que por favor sea amable :-) No pude encontrar la respuesta a esta pregunta, disculpas si ya está respondida en otro lugar en un formato diferente. Tengo un conjunto de datos de transacciones para una tienda minorista. Las variables junto con la explicación …

10 python statistics pandas ipython

1

CÓMO: Inicialización del peso de la red neuronal profunda

Dada una tarea de aprendizaje difícil (por ejemplo, alta dimensionalidad, complejidad de datos inherente), las redes neuronales profundas se vuelven difíciles de entrenar. Para aliviar muchos de los problemas, uno podría: Normalizar && datos de calidad de selección manual elija un algoritmo de entrenamiento diferente (por ejemplo, RMSprop en lugar …

10 machine-learning neural-network deep-learning randomized-algorithms

3

Creación de un modelo de aprendizaje automático para predecir los rendimientos de los cultivos en función de los datos ambientales.

Tengo un conjunto de datos que contiene datos sobre temperatura, precipitación y rendimiento de soja para una granja durante 10 años (2005 - 2014). Me gustaría predecir los rendimientos para 2015 en función de estos datos. Tenga en cuenta que el conjunto de datos tiene valores DIARIOS para temperatura y …

10 python scikit-learn pandas

1

Salida de regresión lineal XGBoost incorrecta

Soy un novato en XGBoost, así que perdona mi ignorancia. Aquí está el código de Python: import pandas as pd import xgboost as xgb df = pd.DataFrame({'x':[1,2,3], 'y':[10,20,30]}) X_train = df.drop('y',axis=1) Y_train = df['y'] T_train_xgb = xgb.DMatrix(X_train, Y_train) params = {"objective": "reg:linear"} gbm = xgb.train(dtrain=T_train_xgb,params=params) Y_pred = gbm.predict(xgb.DMatrix(pd.DataFrame({'x':[4,5]}))) print Y_pred …

10 python linear-regression xgboost

1

Usuario-producto positivo (datos de clic) disponible. ¿Cómo generar negativo (datos sin clic)?

Es muy común en los recomendadores que tengamos datos de productos del usuario que tengan una etiqueta como, por ejemplo, "clic". Para aprender el modelo, necesito datos de clic y sin clic. El enfoque más simple para generar es tomar pares de productos de usuario que no se encuentran en …

10 machine-learning data-mining

2

¿Qué hacer cuando los datos de prueba tienen menos características que los datos de entrenamiento?

Digamos que estamos prediciendo las ventas de una tienda y mis datos de entrenamiento tienen dos conjuntos de características: Uno sobre las ventas de la tienda con las fechas (el campo "Tienda" no es único) Uno sobre los tipos de tienda (el campo "Tienda" es único aquí) Entonces la matriz …

10 machine-learning regression feature-selection feature-construction missing-data

2

¿Cómo se les ocurre a los científicos los parámetros y la topología correctos del Modelo oculto de Markov para usar?

Entiendo cómo se usa un modelo oculto de Markov en secuencias genómicas, como la búsqueda de un gen. Pero no entiendo cómo llegar a un modelo particular de Markov. Quiero decir, ¿cuántos estados debe tener el modelo? ¿Cuántas transiciones posibles? ¿Debería el modelo tener un bucle? ¿Cómo sabrían que su …

10 machine-learning model-selection hyperparameter markov

1

¿Qué tan flexible es el vínculo entre la función objetivo y la función de activación de la capa de salida?

Parece estándar en muchos paquetes de redes neuronales emparejar la función objetivo para minimizarla con la función de activación en la capa de salida. Por ejemplo, para una capa de salida lineal utilizada para la regresión, es estándar (y a menudo la única opción) tener una función objetivo de error …

10 neural-network gradient-descent

1

¿Cuántos datos de entrenamiento necesita word2vec?

Me gustaría comparar la diferencia entre la misma palabra mencionada en diferentes fuentes. Es decir, cómo los autores difieren en el uso de palabras mal definidas, como "democracia". Un breve plan fue Tome los libros que mencionan el término "democracia" como texto sin formato En cada libro, reemplace democracycondemocracy_%AuthorName% Entrenar …

10 text-mining word-embeddings

1

¿Cómo calculo el término delta de una capa convolucional, dados los términos delta y los pesos de la capa convolucional anterior?

Estoy tratando de entrenar una red neuronal artificial con dos capas convolucionales (c1, c2) y dos capas ocultas (c1, c2). Estoy usando el enfoque estándar de retropropagación. En el paso hacia atrás calculo el término de error de una capa (delta) en función del error de la capa anterior, los …

10 machine-learning data-mining neural-network deep-learning

1

¿Tiene que normalizar los datos al construir árboles de decisión con R?

Entonces, nuestro conjunto de datos de esta semana tiene 14 atributos y cada columna tiene valores muy diferentes. Una columna tiene valores inferiores a 1, mientras que otra columna tiene valores que van de tres a cuatro dígitos enteros. Aprendimos normalización la semana pasada y parece que se supone que …

10 r beginner

2

Amplificación de un hash local sensible

Estoy tratando de construir un hash sensible a la localidad coseno para poder encontrar pares de artículos similares candidatos sin tener que comparar cada par posible. Básicamente funciona, pero la mayoría de los pares en mis datos parecen tener una similitud de coseno en el rango de -0.2 a +0.2, …

10 machine-learning

3

¿Están muertas las ontologías y la web semántica? [cerrado]

Cerrada . Esta pregunta necesita estar más centrada . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que se centre en un problema solo editando esta publicación . Cerrado hace 2 años . ¿Está muerta la web semántica? ¿Están muertas las ontologías? Estoy desarrollando un …

10 knowledge-base

2

¿Cuánto tiempo tardan los clasificadores scikit en clasificar?

Estoy planeando usar el clasificador de máquina de vectores de soporte lineal (SVM) scikit para la clasificación de texto en un corpus que consta de 1 millón de documentos etiquetados. Lo que planeo hacer es que, cuando un usuario ingrese alguna palabra clave, el clasificador primero la clasificará en una …

10 machine-learning classification python scikit-learn