Actualmente estoy construyendo una instancia en EC2 en la que importar toda la instantánea de Planet.osm de toda la información de la Tierra para algunos proyectos en los que estamos trabajando. He creado una gran instancia de Ubuntu x64 y he conectado un montón de almacenamiento por separado en un volumen EBS para la base de datos de Postgres y lo modifiqué para alojar allí los datos de PGSQL.
Ahora el servidor está teniendo problemas osm2pgsql
para importar la instantánea ... Después de un par de intentos con diferentes configuraciones de memoria y demás, el proceso sigue mostrando "Killed" después de completar la mayor parte del proceso; una vez que fue asesinado mientras "repasaba las formas pendientes" y la próxima vez, después de ajustar ligeramente el caché delgado, alcanzó "formas de procesamiento" antes de estrellarse. Por lo que he leído, esto generalmente se debe a problemas de memoria.
Aquí está mi último intento de ejecutar la importación:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
Y aquí están las especificaciones para una instancia grande en EC2:
Instancia grande 7.5 GB de memoria, 4 Unidades de Computación EC2 (2 núcleos virtuales con 2 Unidades de Computación EC2 cada una), 850 GB de almacenamiento de instancia local, plataforma de 64 bits
Mi pregunta es: ¿hay algunos buenos recursos de referencia para determinar los requisitos de ajuste para osm2pgsql y Postgres? La velocidad de importación ni siquiera es tan importante para mí, solo me gustaría poder asegurarme de que el proceso se complete de manera segura, incluso si toma 4 o 5 días ... He leído a través de Frederick Ramm " Optimizando la representación documento en cadena "(PDF) del SOTM del año pasado, pero ¿hay otras buenas opiniones / recursos?