La forma de "iniciar" la matriz que desea es:
arr = np.empty((0,3), int)
Que es una matriz vacía pero tiene la dimensionalidad adecuada.
>>> arr
array([], shape=(0, 3), dtype=int64)
Luego asegúrese de agregar a lo largo del eje 0:
arr = np.append(arr, np.array([[1,2,3]]), axis=0)
arr = np.append(arr, np.array([[4,5,6]]), axis=0)
Pero @jonrsharpe tiene razón. De hecho, si va a agregar en un bucle, sería mucho más rápido agregar a una lista como en su primer ejemplo, luego convertir a una matriz numpy al final, ya que realmente no está usando numpy como previsto durante el ciclo:
In [210]: %%timeit
.....: l = []
.....: for i in xrange(1000):
.....: l.append([3*i+1,3*i+2,3*i+3])
.....: l = np.asarray(l)
.....:
1000 loops, best of 3: 1.18 ms per loop
In [211]: %%timeit
.....: a = np.empty((0,3), int)
.....: for i in xrange(1000):
.....: a = np.append(a, 3*i+np.array([[1,2,3]]), 0)
.....:
100 loops, best of 3: 18.5 ms per loop
In [214]: np.allclose(a, l)
Out[214]: True
La forma numpythonic de hacerlo depende de su aplicación, pero sería más como:
In [220]: timeit n = np.arange(1,3001).reshape(1000,3)
100000 loops, best of 3: 5.93 µs per loop
In [221]: np.allclose(a, n)
Out[221]: True