Por lo tanto, GDAL ha agregado recientemente una nueva característica que permite la lectura aleatoria de archivos de cubo S3. Estoy buscando recortar imágenes GDAL de múltiples mosaicos de una imagen sin tener que descargar todo el archivo. Solo he visto documentación muy escasa sobre cómo configurar y acceder a un bucket S3 a través de GDAL y estoy un poco confundido sobre cómo comenzar. ¿Alguien tendría la amabilidad de proporcionar un ejemplo / tutorial extremadamente breve sobre cómo se haría para configurar el sistema de archivos virtual para GDAL para lograr este objetivo? ¡Ptos de bonificación si su solución permite que se realice una secuencia de comandos a través de Python!
Para aclarar: ya lo hemos hecho en Python. El problema con Python es que tienes que descargar toda la imagen para operarla con ella. La versión más nueva de GDAL tiene soporte para montar el cubo S3 de modo que si necesitamos recortar una pequeña porción de la imagen, podamos operar directamente en esa porción más pequeña. Por desgracia, como la característica solo se lanzó en la rama estable en enero, no he encontrado ninguna documentación al respecto. Por lo tanto, la solución debería usar el sistema VSI3 en la versión más reciente de GDAL o usar el sistema de manera inteligente para evitar que el usuario necesite descargar la imagen completa a una unidad EBS para operarla.
Es decir, se otorgará la recompensa por la respuesta que utiliza las API de VSI que se encuentran en las versiones más recientes de GDAL para que no sea necesario leer todo el archivo en la memoria o el disco. Además, los cubos que usamos no siempre son públicos, por lo que muchos de los trucos HTTP que se publican no funcionarán en muchas de nuestras situaciones.