2
¿La forma más eficiente (tiempo, costo) de raspar 5 millones de páginas web?
Tengo una lista de páginas web que necesito para raspar, analizar y luego almacenar los datos resultantes en una base de datos. El total es de alrededor de 5,000,000. Mi suposición actual de la mejor manera de abordar esto es implementar ~ 100 instancias EC2, proporcionar a cada instancia 50,000 …