Estadísticas y Big Data neural-networks

4

En CNN, ¿son iguales el muestreo ascendente y la convolución de transposición?

Los términos "muestreo ascendente" y "convolución de transposición" se usan cuando se está haciendo "deconvolución" (<- no es un buen término, pero déjenme usarlo aquí). Originalmente, pensé que significaban lo mismo, pero me parece que son diferentes después de leer estos artículos. alguien puede por favor aclarar? Transvolución de convolución …

12 machine-learning neural-networks conv-neural-network transposed-convolution

1

¿Qué es exactamente un bloque de aprendizaje residual en el contexto de las redes residuales profundas en el aprendizaje profundo?

Estaba leyendo el artículo Aprendizaje residual profundo para el reconocimiento de imágenes y tuve dificultades para comprender con 100% de certeza lo que implica un bloqueo residual computacionalmente. Leyendo su periódico tienen la figura 2: que ilustra lo que se supone que es un Bloque residual. ¿El cálculo de un …

12 machine-learning neural-networks deep-learning conv-neural-network residual-networks

2

Diferentes definiciones de la función de pérdida de entropía cruzada

Comencé a aprender sobre redes neuronales con el tutorial de redes neuronales y aprendizaje de punto com. En particular, en el tercer capítulo hay una sección sobre la función de entropía cruzada, y define la pérdida de entropía cruzada como: C=−1n∑x∑j(yjlnaLj+(1−yj)ln(1−aLj))C=−1n∑x∑j(yjln⁡ajL+(1−yj)ln⁡(1−ajL))C = -\frac{1}{n} \sum\limits_x \sum\limits_j (y_j \ln a^L_j + (1-y_j) …

12 neural-networks loss-functions softmax cross-entropy

3

Fecha / hora de codificación (datos cíclicos) para redes neuronales

¿Cómo codificar la fecha y hora de un evento para una red neuronal? No tengo una serie temporal continua, sino algunos eventos con fecha y hora, y analizo algún tipo de interés. Este interés difiere entre las mañanas y las tardes, y difiere entre los días de la semana, y …

12 neural-networks deep-learning

2

¿Cómo funciona la operación DepthConcat en 'Profundizando con convoluciones'?

Lectura Profundizando en convoluciones Me encontré con una capa de DepthConcat , un bloque de construcción de los módulos de inicio propuestos , que combina la salida de múltiples tensores de diferentes tamaños. Los autores llaman a esto "Concatenación de filtro". Parece que hay una implementación para Torch , pero …

12 neural-networks torch conv-neural-network

1

Prueba exacta de Fisher y distribución hipergeométrica

Quería entender mejor la prueba exacta del pescador, así que ideé el siguiente ejemplo de juguete, donde f y m corresponde a machos y hembras, y n e y corresponden a "consumo de refrescos" de esta manera: > soda_gender f m n 0 5 y 5 0 Obviamente, esta es …

12 fishers-exact hypergeometric clustering supervised-learning modeling econometrics r regression residuals heteroscedasticity independence distributions self-study matlab libsvm self-study conditional-probability conditional-expectation hypothesis-testing self-study multiple-comparisons mode statistical-significance chi-squared multiple-comparisons maximum-likelihood poisson-process optimization uncertainty genetic-algorithms bayesian model-selection overfitting maximum-likelihood optimization approximation r prediction model-evaluation r machine-learning survival neural-networks cox-model machine-learning bayesian bayesian-network hierarchical-bayesian pooling

2

¿Qué tan profunda es la conexión entre la función softmax en ML y la distribución de Boltzmann en termodinámica?

La función softmax, comúnmente utilizada en redes neuronales para convertir números reales en probabilidades, es la misma función que la distribución de Boltzmann, la distribución de probabilidad sobre las energías para un conjunto de partículas en equilibrio térmico a una temperatura T dada en termodinámica. Puedo ver algunas razones heurísticas …

12 machine-learning neural-networks softmax

2

¿Elegir el tamaño del filtro, zancadas, etc. en una CNN?

He estado mirando las conferencias CS231N de Stanford y estoy tratando de entender algunos problemas en las arquitecturas de CNN. Lo que estoy tratando de entender es si hay algunas pautas generales para elegir el tamaño del filtro de convolución y cosas como avances o ¿es esto más un arte …

12 neural-networks deep-learning conv-neural-network

3

No linealidad antes de la capa Softmax final en una red neuronal convolucional

Estoy estudiando e intentando implementar redes neuronales convolucionales, pero supongo que esta pregunta se aplica a los perceptrones multicapa en general. Las neuronas de salida en mi red representan la activación de cada clase: la neurona más activa corresponde a la clase predicha para una entrada dada. Para considerar un …

12 neural-networks deep-learning conv-neural-network nonlinear softmax

4

¿Cuáles son las diferencias entre autoencoders y t-SNE?

Hasta donde yo sé, tanto los autoencoders como el t-SNE se usan para la reducción de dimensionalidad no lineal. ¿Cuáles son las diferencias entre ellos y por qué debería usar uno versus otro?

12 neural-networks deep-learning dimensionality-reduction autoencoders tsne

2

Diferencia entre una sola unidad LSTM y una red neuronal LSTM de 3 unidades

El LSTM en el siguiente código Keras input_t = Input((4, 1)) output_t = LSTM(1)(input_t) model = Model(inputs=input_t, outputs=output_t) print(model.summary()) puede ser representado como Entiendo que cuando llamamos a model.predict(np.array([[[1],[2],[3],[4]]]))la (única) unidad LSTM, primero se procesa el vector [1], luego [2] más la retroalimentación de la entrada anterior y así sucesivamente …

12 machine-learning neural-networks lstm keras

2

Regresión lineal simple en Keras

Después de analizar esta pregunta: Intentando emular la regresión lineal usando Keras , he intentado dar mi propio ejemplo, solo para estudiar y desarrollar mi intuición. Descargué un conjunto de datos simple y usé una columna para predecir otra. Los datos se ven así: Ahora acabo de crear un modelo …

12 regression machine-learning neural-networks linear keras

1

Aproximación de segundo orden de la función de pérdida (Libro de aprendizaje profundo, 7.33)

En el libro de Goodfellow (2016) sobre aprendizaje profundo, habló sobre la equivalencia de la parada temprana a la regularización L2 ( https://www.deeplearningbook.org/contents/regularization.html página 247). La aproximación cuadrática de la función de costo viene dada por:jjj J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)\hat{J}(\theta)=J(w^*)+\frac{1}{2}(w-w^*)^TH(w-w^*) donde es la matriz de Hesse (Ec. 7.33). ¿Falta esto el término medio? …

11 neural-networks deep-learning loss-functions derivative

2

¿Por qué las CNN concluyen con capas FC?

Según tengo entendido, las CNN consisten en dos partes. La primera parte (capas conv / pool) que realiza la extracción de características y la segunda parte (capas fc) que realiza la clasificación de las características. Dado que las redes neuronales completamente conectadas no son los mejores clasificadores (es decir, la …

11 neural-networks svm random-forest conv-neural-network

3

Sensibilidad de escala de red neuronal convolucional

Por ejemplo, supongamos que estamos construyendo un estimador de edad, basado en la imagen de una persona. A continuación tenemos dos personas en trajes, pero la primera es claramente más joven que la segunda. (fuente: tinytux.com ) Hay muchas características que implican esto, por ejemplo, la estructura de la cara. …

11 neural-networks computer-vision

Preguntas etiquetadas con neural-networks