Python URLRetrieve Limit Rate и возобновление частичной загрузки - PullRequest
2 голосов
/ 26 декабря 2010

Я использую код из этой темы , чтобы ограничить мою скорость загрузки.

Как включить частичные загрузки, возобновляемые с кодом ограничения скорости?Примеры, которые я нашел, используют urlopen вместо urlretrieve, а класс RateLimit зависит от urlretrieve.

Я хотел бы иметь внешнюю функцию, которая контролирует частичную загрузку, безнеобходимость изменить RateLimit класс:

from throttle import TokenBucket, RateLimit

def retrieve_limit_rate(url, filename, rate_limit):
    """Fetch the contents of urls"""
    bucket = TokenBucket(10*rate_limit, rate_limit)

    print "rate limit = %.1f kB/s" % (rate_limit,)

    print 'Downloading %s...' % filename
    rate_limiter = RateLimit(bucket, filename)
    #
    # What do I put here to allow resuming files?
    #
    return urllib.urlretrieve(url, filename, rate_limiter)

1 Ответ

4 голосов
/ 26 декабря 2010

Может вместо этого использовать PyCurl:

def curl_progress(total, existing, upload_t, upload_d):
    try:
        frac = float(existing)/float(total)
    except:
        frac = 0
    print "Downloaded %d/%d (%0.2f%%)" % (existing, total, frac)

def curl_limit_rate(url, filename, rate_limit):
    """Rate limit in bytes"""
    import pycurl
    c = pycurl.Curl()
    c.setopt(c.URL, url)
    c.setopt(c.MAX_RECV_SPEED_LARGE, rate_limit)
    if os.path.exists(filename):
        file_id = open(filename, "ab")
        c.setopt(c.RESUME_FROM, os.path.getsize(filename))
    else:
        file_id = open(filename, "wb")

    c.setopt(c.WRITEDATA, file_id)
    c.setopt(c.NOPROGRESS, 0)
    c.setopt(c.PROGRESSFUNCTION, curl_progress)
    c.perform()
...