wget.download () работает только для некоторых ссылок - PullRequest
2 голосов
/ 20 июня 2020

У меня есть список некоторых ссылок (это файлы в формате pdf). Я набираю wget.download() для каждой ссылки в списке. Однако только некоторые из них загружаются, а затем я получаю:

File "/home/.local/lib/python3.6/site-packages/wget.py", line 526, in download
    (tmpfile, headers) = ulib.urlretrieve(binurl, tmpfile, callback)
  File "/usr/lib/python3.6/urllib/request.py", line 248, in urlretrieve
    with contextlib.closing(urlopen(url, data)) as fp:
  File "/usr/lib/python3.6/urllib/request.py", line 223, in urlopen
    return opener.open(url, data, timeout)
  File "/usr/lib/python3.6/urllib/request.py", line 532, in open
    response = meth(req, response)
  File "/usr/lib/python3.6/urllib/request.py", line 642, in http_response
    'http', request, response, code, msg, hdrs)
  File "/usr/lib/python3.6/urllib/request.py", line 570, in error
    return self._call_chain(*args)
  File "/usr/lib/python3.6/urllib/request.py", line 504, in _call_chain
    result = func(*args)
  File "/usr/lib/python3.6/urllib/request.py", line 650, in http_error_default
    raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 404: Not Found

Я также пытался использовать r = requests.get(link), но проблема все та же, и, кроме того, я получаю эту ошибку:

  File "/usr/lib/python3.6/urllib/request.py", line 532, in open
    response = meth(req, response)
  File "/usr/lib/python3.6/urllib/request.py", line 642, in http_response
    'http', request, response, code, msg, hdrs)
  File "/usr/lib/python3.6/urllib/request.py", line 570, in error
    return self._call_chain(*args)
  File "/usr/lib/python3.6/urllib/request.py", line 504, in _call_chain
    result = func(*args)
  File "/usr/lib/python3.6/urllib/request.py", line 650, in http_error_default
    raise HTTPError(req.full_url, code, msg, hdrs, fp

Пример ссылки, которая не загружается:

https://cnds.jacobs-university.de/courses/sads-2020/p6.pdf

Если я открою ссылку в своем браузере, я получу загрузку. Кроме того, этот метод работал несколько месяцев назад. Идк, почему он больше не работает

1 Ответ

0 голосов
/ 20 июня 2020

Я пока не могу комментировать, но пробовали ли вы загружать файлы с помощью браузера вручную? Если это сработает, значит, проблема в том, что wget по какой-то причине не может достичь цели.

...