поврежденный файл Excel при загрузке с использованием клиентов HTTP-запросов - PullRequest
1 голос
/ 02 апреля 2020

Когда я пытаюсь загрузить файл Excel по ссылке ниже с любого клиента HTTP-запроса (запросы, urllib3, aiohttp), клиент загружает поврежденный файл Excel. (Кстати, ссылка имеет статус разрешения на импорт от правительства Кореи)

import requests
import pandas as pd

url = 'https://impfood.mfds.go.kr/CFCCC01F01/getExcelFile?dclPrductSeCd=3&srchStrtDt=2019-01-01&srchEndDt=2019-12-31&rpsntItmCd=B01020100000000283CA'

resp = requests.get(url=url, stream=True)
assert resp.status_code == 200, "download failed"

with open("temp.xlsx", "wb") as writer:
    for chunk in resp.iter_content(chunk_size=None):
        writer.write(chunk)

df = pd.read_excel("temp.xlsx")

print(df.head())

Но когда я пытаюсь загрузить его из браузера, wget и curl, файл в порядке.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...