urllib2 Мониторинг прогресса POST - PullRequest
10 голосов
/ 08 мая 2011

Я загружаю довольно большой файл с urllib2 в серверный скрипт через POST. Я хочу отобразить индикатор прогресса, который показывает текущий прогресс загрузки. Есть ли перехватчик или обратный вызов, предоставленный urllib2, который позволяет мне отслеживать ход загрузки? Я знаю, что вы можете сделать это с помощью загрузки, используя последовательные вызовы метода read () соединения, но я не вижу метода write (), вы просто добавляете данные в запрос.

Ответы [ 4 ]

23 голосов
/ 08 мая 2011

Это возможно, но вам нужно сделать несколько вещей:

  • Подделать подсистему urllib2 для передачи дескриптора файла в httplib, добавив атрибут __len__, который возвращает len(data)правильный размер, используемый для заполнения заголовка Content-Length.
  • Переопределите метод read() в дескрипторе файла: при вызове httplib read() будет вызван ваш обратный вызов, что позволит вам вычислить процент и обновить вашиндикатор выполнения.

Это может работать с любым файловым объектом, но я обернул file, чтобы показать, как он может работать с действительно большим файлом, передаваемым с диска:

import os, urllib2
from cStringIO import StringIO

class Progress(object):
    def __init__(self):
        self._seen = 0.0

    def update(self, total, size, name):
        self._seen += size
        pct = (self._seen / total) * 100.0
        print '%s progress: %.2f' % (name, pct)

class file_with_callback(file):
    def __init__(self, path, mode, callback, *args):
        file.__init__(self, path, mode)
        self.seek(0, os.SEEK_END)
        self._total = self.tell()
        self.seek(0)
        self._callback = callback
        self._args = args

    def __len__(self):
        return self._total

    def read(self, size):
        data = file.read(self, size)
        self._callback(self._total, len(data), *self._args)
        return data

path = 'large_file.txt'
progress = Progress()
stream = file_with_callback(path, 'rb', progress.update, path)
req = urllib2.Request(url, stream)
res = urllib2.urlopen(req)

Вывод:

large_file.txt progress: 0.68
large_file.txt progress: 1.36
large_file.txt progress: 2.04
large_file.txt progress: 2.72
large_file.txt progress: 3.40
...
large_file.txt progress: 99.20
large_file.txt progress: 99.87
large_file.txt progress: 100.00
1 голос
/ 02 октября 2013

запросов 2.0.0 имеет потоковую загрузку .Это означает, что вы можете использовать генератор, чтобы выдавать крошечные куски и печатать прогресс между кусками.

0 голосов
/ 05 февраля 2016

плакат поддерживает это

import json
import os
import sys
import urllib2

from poster.encode import multipart_encode
from poster.streaminghttp import register_openers

def _upload_progress(param, current, total):
    sys.stdout.write(
        "\r{} - {:.0f}%                "
        .format(param.name,
                (float(current) / float(total)) * 100.0))
    sys.stdout.flush()

def upload(request_resource, large_file_path):
    register_openers()
    with open(large_file_path, 'r') as large_file:
        request_data, request_headers = multipart_encode(
            [('file', largs_file)],
            cb=_upload_progress)

        request_headers.update({
            'X-HockeyAppToken': 'we use this for hockeyapp upload'
        })

        upload_request = urllib2.Request(request_resource,
                                         request_data, 
                                         request_headers)
        upload_connection = urllib2.urlopen(upload_request)
        upload_response = json.load(upload_connection)
    print "Done"
0 голосов
/ 08 мая 2011

Я не думаю, что это возможно, но pycurl имеет обратные вызовы прогресса загрузки / выгрузки , которые вы можете использовать.

...