Ciencia de los datos

2

¿Cómo implementar la predicción de secuencia "uno a muchos" y "muchos a muchos" en Keras?

Me cuesta interpretar la diferencia de codificación Keras para el etiquetado de secuencia de uno a muchos (por ejemplo, clasificación de imágenes individuales) y de muchos a muchos (por ejemplo, clasificación de secuencias de imágenes). Frecuentemente veo dos tipos diferentes de códigos: El tipo 1 es donde no se aplica …

13 keras rnn lstm sequence

4

Intervalo de predicción alrededor del pronóstico de series de tiempo LSTM

¿Existe algún método para calcular el intervalo de predicción (distribución de probabilidad) alrededor de un pronóstico de serie temporal de una red neuronal LSTM (u otra red recurrente)? Digamos, por ejemplo, que pronostico 10 muestras en el futuro (t + 1 a t + 10), con base en las últimas …

13 machine-learning deep-learning time-series prediction lstm

3

¿En qué se diferencian las NN de aprendizaje profundo ahora (2016) de las que estudié hace solo 4 años (2012)?

Se dice en Wikipedia y deeplearning4j que los NN de aprendizaje profundo (DLNN) son NN que tienen> 1 capa oculta. Este tipo de NN era estándar en la universidad para mí, mientras que DLNN es muy publicitado en este momento. He estado allí, hecho eso, ¿cuál es el problema? También …

13 neural-network deep-learning

4

Diferente conjunto de pruebas y distribución de conjuntos de entrenamiento

Estoy trabajando en una competencia de ciencia de datos para la cual la distribución de mi conjunto de pruebas es diferente del conjunto de entrenamiento. Quiero submuestrear observaciones del conjunto de entrenamiento que se parece mucho al conjunto de prueba. ¿Cómo puedo hacer esto?

13 preprocessing

3

¿Qué significa cuando decimos que la mayoría de los puntos en un hipercubo están en el límite?

Si tengo un hipercubo de 50 dimensiones. Y defino su límite por o donde es la dimensión del hipercubo. Luego, calcular la proporción de puntos en el límite del hipercubo será . Qué significa eso? ¿Significa que el resto del espacio está vacío? Si el de los puntos están en …

13 machine-learning math

3

¿Qué significa "lineal en parámetros"?

El modelo de regresión lineal es lineal en parámetros. ¿Qué significa esto realmente?

13 regression linear-regression

4

En el algoritmo SVM, ¿por qué el vector w es ortogonal al hiperplano de separación?

Soy un principiante en Machine Learning. En SVM, el hiperplano de separación se define como . Por eso decimos vector ortogonal al hiperplano que separa?wy=wTx+by=wTx+by = w^T x + bwww

13 machine-learning svm

2

¿Cómo se aplica SMOTE en la clasificación de texto?

La técnica de sobremuestreo de minorías sintéticas (SMOTE) es una técnica de sobremuestreo utilizada en un problema de conjunto de datos desequilibrado. Hasta ahora tengo una idea de cómo aplicarlo en datos genéricos y estructurados. ¿Pero es posible aplicarlo en un problema de clasificación de texto? ¿Qué parte de los …

13 unbalanced-classes text smote

4

¿Una alternativa de codificación activa para grandes valores categóricos?

Hola, tengo un marco de datos con grandes valores categóricos en más de 1600 categorías. ¿Hay alguna forma de encontrar alternativas para no tener más de 1600 columnas? Encontré esto debajo del enlace interesante http://amunategui.github.io/feature-hashing/#sourcecode Pero se están convirtiendo a clase / objeto que no quiero. ¿Quiero mi salida final …

13 machine-learning dataset dimensionality-reduction encoding

5

Ventajas del marco de datos de pandas para la base de datos relacional regular

En Data Science, muchos parecen estar usando marcos de datos de pandas como el almacén de datos. ¿Cuáles son las características de los pandas que lo convierten en un almacén de datos superior en comparación con las bases de datos relacionales normales como MySQL , que se utilizan para almacenar …

13 pandas databases

2

Actualización de los pesos de los filtros en una CNN

Actualmente estoy tratando de entender la arquitectura de una CNN. Entiendo la convolución, la capa ReLU, la capa de agrupación y la capa totalmente conectada. Sin embargo, todavía estoy confundido acerca de los pesos. En una red neuronal normal, cada neurona tiene su propio peso. En la capa completamente conectada, …

13 machine-learning neural-network deep-learning image-classification cnn

4

Dimensionalidad y múltiple

Una oración comúnmente escuchada en el aprendizaje automático sin supervisión es Las entradas de alta dimensión generalmente viven en o cerca de un múltiple de baja dimensión ¿Qué es una dimensión? ¿Qué es un múltiple? ¿Cuál es la diferencia? ¿Puedes dar un ejemplo para describir ambos? Colector de Wikipedia: En …

13 machine-learning dimensionality-reduction

2

¿Por qué no usar siempre la técnica de optimización de ADAM?

Parece el optimizador Adaptive Moment Estimation (Adam) casi siempre funciona mejor (alcanza un mínimo global de manera más rápida y confiable) al minimizar la función de costo en el entrenamiento de redes neuronales. ¿Por qué no usar siempre a Adán? ¿Por qué molestarse incluso en usar RMSProp u optimizadores de …

12 neural-network optimization

1

Keras de pronóstico de series temporales multidimensionales y multivariantes (RNN / LSTM)

He estado tratando de entender cómo representar y dar forma a los datos para hacer una predicción de series de tiempo multidimensional y multivariante usando Keras (o TensorFlow), pero todavía no estoy muy claro después de leer muchas publicaciones / tutoriales / documentación del blog sobre cómo presentar los datos …

12 python keras rnn lstm

1

Aprendizaje multitarea en Keras

Estoy tratando de implementar capas compartidas en Keras. Veo que Keras sí keras.layers.concatenate, pero no estoy seguro de la documentación sobre su uso. ¿Puedo usarlo para crear múltiples capas compartidas? ¿Cuál sería la mejor manera de implementar una red neuronal compartida simple como se muestra a continuación utilizando Keras? Tenga …

12 machine-learning neural-network deep-learning keras multitask-learning