El siguiente ejemplo está tomado de las conferencias en deeplearning.ai muestra que el resultado es la suma del producto elemento por elemento (o "multiplicación por elementos". Los números rojos representan los pesos en el filtro:
SIN EMBARGO, la mayoría de los recursos dicen que se utiliza el producto punto :
"... podemos reexpresar la salida de la neurona como, donde está el término de sesgo. En otras palabras, podemos calcular la salida por y = f (x * w) donde b es el término de sesgo. En otras palabras, nosotros puede calcular la salida realizando el producto punto de los vectores de entrada y ponderación, agregando el término de sesgo para producir el logit y luego aplicando la función de transformación ".
Buduma, Nikhil; Locascio, Nicholas. Fundamentos del aprendizaje profundo: diseño de algoritmos de inteligencia de máquina de próxima generación (p. 8). O'Reilly Media. Versión Kindle.
"Tomamos el filtro 5 * 5 * 3 y lo deslizamos sobre la imagen completa y en el camino tomamos el producto de punto entre el filtro y los fragmentos de la imagen de entrada. Para cada producto de punto tomado, el resultado es un escalar".
"Cada neurona recibe algunas entradas, realiza un producto de puntos y, opcionalmente, lo sigue con una no linealidad".
http://cs231n.github.io/convolutional-networks/
"El resultado de una convolución es ahora equivalente a realizar una matriz grande multiplicar np.dot (W_row, X_col), que evalúa el producto de punto entre cada filtro y cada ubicación de campo receptivo".
http://cs231n.github.io/convolutional-networks/
Sin embargo, cuando investigo cómo calcular el producto de punto de las matrices , parece que el producto de punto no es lo mismo que sumar la multiplicación elemento por elemento. ¿Qué operación se usa realmente (multiplicación elemento por elemento o el producto punto) y cuál es la diferencia principal?
Hadamard product
entre el área seleccionada y el núcleo de convolución.