загрузка файла с использованием urllib3 UnicodeDecodeError - PullRequest
1 голос
/ 05 марта 2020

Я пытаюсь загрузить файл через POST-запрос из нескольких частей, используя urllib3. Я следовал этому примеру из urllib docs :

>>> with open('example.txt') as fp:
...     file_data = fp.read()
>>> r = http.request(
...     'POST',
...     'http://httpbin.org/post',
...     fields={
...         'filefield': ('example.txt', file_data),
...     })
>>> json.loads(r.data.decode('utf-8'))['files']
{'filefield': '...'}

Когда я адаптировал пример кода, я добавил несколько дополнительных полей, требуемых API, в который я загружаю:

import urllib3

http = urllib3.PoolManager()

with open('/Volumes/GoogleDrive/My Drive/Code/Fuse-Qu/qu/uploads/risk.pdf') as fp:
    file_data = fp.read()

r = http.request(
    'POST',
    'https://***.fuseuniversal.com/api/v4.2/contents/media?auth_token=***',
    fields={
        "name": "test api upload 11",
        "description": "this is a test of uploading a pdf via the api",
        "composite_attributes[type]": "File",
        "community_ids": "24827",
        "composite_attributes[file]": ('risk.pdf', file_data, 'document/pdf'),
    })

Однако я получаю эту ошибку:

Traceback (most recent call last):
  File "test-urllib.py", line 6, in <module>
    file_data = fp.read()
  File "/Users/dunc/.pyenv/versions/3.8.1/lib/python3.8/codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe2 in position 10: invalid continuation byte

1 Ответ

2 голосов
/ 05 марта 2020

Вам нужно открыть файл в двоичном режиме, потому что это не текст. Если вы открываете файл без указания двоичного файла, python3 автоматически пытается декодировать содержимое как utf-8. Вот обновленные ошибочные строки:

with open('/Volumes/GoogleDrive/My Drive/Code/Fuse-Qu/qu/uploads/risk.pdf', 'rb') as fp:
    file_data = fp.read()
...