Используйте wget для загрузки изображений из Твиттера с указанием размера - PullRequest
0 голосов
/ 20 февраля 2019

Я использую библиотеку wget в Python для загрузки изображений из твиттера, которые я отфильтровал через хэштеги.Twitter дает нам возможность выбрать размер изображения, которое мы хотим видеть, добавив размер в конце URL.

Например: https://pbs.twimg.com/media/DzzjbQ5UYAEh5Y8.jpg:medium

Этот URL сам по себе может бытьпросмотрел, но когда я пытаюсь использовать на нем команду wget (wget.download(url)).Я получаю сообщение об ошибке

urllib.error.HTTPError: HTTP Error 404: Not Found

. Конечно, когда я удаляю носитель в конце URL-адреса, я могу просматривать и загружать его по ссылке.

Может кто-нибудь сказать мне, что мы можемсделать, чтобы разрешить загрузку изображения с описанием размера с помощью wget?

1 Ответ

0 голосов
/ 20 февраля 2019

Это похоже на ошибку в Python wget - я поднял ее как проблему на https://bitbucket.org/techtonik/python-wget/issues/26/urls-with-colon-in-path-404

Я предлагаю использовать requests.Это немного больше кода, но он работает: -)

import requests

image = requests.get("https://pbs.twimg.com/media/DzzjbQ5UYAEh5Y8.jpg:medium")
if 200 == image.status_code:
    with open("image.jpg", 'wb') as f:
        f.write(image.content)
...