Obtendrá una respuesta mucho mejor si proporciona algunos detalles técnicos más sobre qué tipo de datos está tratando de poner bajo control de versión, cómo desea almacenar diferentes versiones de los datos, qué componentes es probable que cambien y qué componentes no son, y si realmente va a tener un historial similar a un árbol (ramas, fusiones).
Los archivos HDF5 no son adecuados para el control de versiones basado en diff bajo git.
git usa una base de datos basada en hash debajo del capó, por lo que es posible almacenar el hash de su archivo de datos HDF5 sin almacenar el archivo en sí. Tres proyectos, git-fat , git-annex y git-media , simplifican enormemente este proceso para usted. Sugeriría usar este enfoque si tiene grandes cantidades de datos completamente independientes que le gustaría versionar explícitamente.
Si puede separar su almacenamiento de datos en regiones no volátiles y volátiles, esto mejorará en gran medida la eficiencia de su interacción con la base de datos de control de versiones. También es posible que desee considerar explícitamente el uso de una base de datos para sus datos si no necesita las funciones de DVCS que ofrece git.