Я пытаюсь очистить ссылку на изображение с веб-страницы, используя мой следующий скрипт, но когда я его запускаю, скрипт получает две ссылки (одну и ту же ссылку дважды) оттуда. Почему я получаю такие странные результаты?
Мне нужно сохранить формат понимания списка, так как есть несколько страниц, где я могу видеть более одного изображения ссылки. Однако я не хочу использовать set()
для удаления этих дублированных ссылок на изображения. Есть ли где-нибудь я ошибаюсь при использовании селектора?
Ссылка на эту веб-страницу
Это моя попытка:
import requests
from bs4 import BeautifulSoup
url = "check_out_the_link_above"
def get_image_links(s,link):
s.headers["User-Agent"] = "Mozilla/5.0"
res = s.get(link)
soup = BeautifulSoup(res.text,"lxml")
images = [item.get("src") for item in soup.select("img.dp-gallery__image")]
print(images)
if __name__ == '__main__':
with requests.Session() as s:
get_image_links(s,url)
Результат, который я получаю:
['https://lid.zoocdn.com/645/430/f8eaf79c39145242e9a30e8d550972e07c0d15a1.jpg', 'https://lid.zoocdn.com/645/430/f8eaf79c39145242e9a30e8d550972e07c0d15a1.jpg']
Одна ссылка дважды, которую я не хочу.