Сохранить изображения из Subreddit в папку Python - PullRequest
1 голос
/ 12 апреля 2019

Я читал много документации по Praw, bs4, и я посмотрел на примеры других людей, как это сделать, но я просто не могу заставить что-то работать так, как мне хотелось бы. Я думал, что это будет довольно простой сценарий, но каждый найденный мной пример написан на python2 или просто не работает вообще.

Я бы хотел, чтобы скрипт загружал 10 лучших изображений из данного субредита и сохранял их в папке.

Если бы кто-нибудь мог указать мне направление записи, это было бы здорово. Приветствия

1 Ответ

1 голос
/ 15 апреля 2019

Поток высокого уровня будет выглядеть примерно так -

  1. Итерирование по верхним постам вашего subreddit.
  2. Извлечение URL отправки.
  3. Проверьте, является ли URL изображением.
  4. Сохраните изображение в нужной папке.
  5. Остановитесь, когда у вас будет 10 изображений.

Вот пример того, как этоможет быть реализовано -

import urllib.request

subreddit = reddit.subreddit("aww")
count = 0

# Iterate through top submissions
for submission in subreddit.top(limit=None):

    # Get the link of the submission
    url = str(submission.url)

    # Check if the link is an image
    if url.endswith("jpg") or url.endswith("jpeg") or url.endswith("png"):

        # Retrieve the image and save it in current folder
        urllib.request.urlretrieve(url, f"image{count}")
        count += 1

        # Stop once you have 10 images
        if count == 10:
            break
...