He estado usando HDF5 durante años, pero a medida que aumenta el tamaño del conjunto de datos, estoy empezando a experimentar los mismos problemas enumerados aquí.
http://cyrille.rossant.net/moving-away-hdf5/
¿Me puede indicar un formato como HDF5 con - Buen soporte para escrituras paralelas - Soporte para acceso fragmentado de matrices enormes
Mi caso de uso típico es una matriz entera de 100k x 100k. Me gustaría tenerlo como un archivo completo desde una perspectiva lógica, pero necesito escribirlo trozo a trozo con trabajadores paralelos.