Для начала я новичок в python, поэтому мой код ниже может быть не самым чистым. Для программы мне нужно скачать около 500 веб-страниц. URL-адреса хранятся в массиве, который заполняется предыдущей функцией. Часть загрузки выглядит примерно так:
def downloadpages(num):
import urllib
for i in range(0,numPlanets):
urllib.urlretrieve(downloadlist[i], 'webpages/'+names[i]'.htm')
каждый файл занимает всего около 20 КБ, но для их загрузки требуется не менее 10 минут. Загрузка одного файла с общим объединенным размером должна занимать всего минуту или две. Есть ли способ, которым я могу ускорить это? Спасибо
Редактировать: Для всех, кто заинтересован, следуя примеру на http://code.google.com/p/workerpool/wiki/MassDownloader и используя 50 потоков, время загрузки было сокращено примерно до 20 секунд с первоначальных 10 минут плюс. Скорость загрузки продолжает уменьшаться, так как потоки увеличиваются примерно до 60 потоков, после чего время загрузки снова начинает увеличиваться.