Я использую txaws с витой для работы S3, хотя вам, вероятно, понадобится просто получить аутентифицированный URL и использовать twisted.web.client.DownloadPage (по умолчанию с удовольствием перейдет из потока в файл без особого взаимодействие).
Twisted позволяет легко работать с любым параллелизмом, который вы хотите. Для чего-то порядка 200 000 я бы, вероятно, сделал бы генератор и использовал бы кооператор для установки моего параллелизма и просто позволил бы генератору генерировать каждый требуемый запрос на загрузку.
Если вы не знакомы с витой, вы обнаружите, что к этой модели требуется немного времени, но она того стоит. В этом случае я ожидаю, что это потребует минимальных затрат ресурсов процессора и памяти, но вам придется беспокоиться о дескрипторах файлов. В перспективном брокере довольно легко смешать и распределить работу между несколькими компьютерами, если вам понадобится больше файловых дескрипторов или если у вас есть несколько соединений, которые вы хотите отключить.