Как очистить изображения с сайта с помощью Beautiful Soup? - PullRequest
0 голосов
/ 08 мая 2020

Я пытаюсь получить набор образцов изображений плетения с сайта

цель состоит в том, чтобы создать набор данных для творческого проекта

код и снимок экрана сайта для очистки включены ниже

любые указатели приветствуются, спасибо

'' '

from bs4 import BeautifulSoup
import requests
import urllib.request
import shutil

url = "https://cdndrafts-01-2019.handweaving.net"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
aas = soup.find_all("right-padding", class_='img')

image_info = []
for a in aas:
    image_tag = a.findChildren('img')
    image_info.append((image_tag[0]['src'], image_tag[0]['alt']))

def download_image(image):
    response = requests.get(image[0], stream=True)
    realname = ''.join(e for e in image[1] if e.isalnum())    
    file = open("C://cdnddrafts{}/jpg".format(realname))   
    response.raw.decode_conent = True
    shutil.copyfileobj(response.raw, file)
    del response

for i in range(0, len(image_info)):
    download_image(image_info[i])
'''

одно из изображений для очистки

1 Ответ

1 голос
/ 11 мая 2020

Это красивое подробное руководство о том, как это сделать, взгляните. Некоторые части избыточны, и вы можете их не указывать.

...