En matemáticas, creo que el punto en numpy tiene más sentido
punto (a, b) _ {i, j, k, a, b, c} =
ya que da el producto escalar cuando ayb son vectores, o la multiplicación de matrices cuando ayb son matrices
En cuanto a la operación matmul en numpy, consta de partes del resultado del punto , y se puede definir como
> matmul (a, b) _ {i, j, k, c} =
Entonces, puede ver que matmul (a, b) devuelve una matriz con una forma pequeña, que tiene un menor consumo de memoria y tiene más sentido en las aplicaciones. En particular, combinándolo con la radiodifusión , puede obtener
matmul (a, b) _ {i, j, k, l} =
por ejemplo.
De las dos definiciones anteriores, puede ver los requisitos para utilizar esas dos operaciones. Suponga a.shape = (s1, s2, s3, s4) y b.shape = (t1, t2, t3, t4)
Para usar el punto (a, b) necesitas
- t3 = s4 ;
Para usar matmul (a, b) necesitas
- t3 = s4
- t2 = s2 , o uno de t2 y s2 es 1
- t1 = s1 , o uno de t1 y s1 es 1
Utilice el siguiente código para convencerse.
Muestra de código
import numpy as np
for it in xrange(10000):
a = np.random.rand(5,6,2,4)
b = np.random.rand(6,4,3)
c = np.matmul(a,b)
d = np.dot(a,b)
#print 'c shape: ', c.shape,'d shape:', d.shape
for i in range(5):
for j in range(6):
for k in range(2):
for l in range(3):
if not c[i,j,k,l] == d[i,j,k,j,l]:
print it,i,j,k,l,c[i,j,k,l]==d[i,j,k,j,l] #you will not see them