Как сканировать ссылку на изображение - Python & beautifulsoup - PullRequest
1 голос
/ 21 февраля 2020

Я в настоящее время сканирую веб-страницу (https://www.getyourguide.de/s/?q=tokio&customerSearch=1&searchSource=2), используя Python 3.7 и bs4, чтобы собрать изображения соответствующих действий.

Я обнаружил, что ссылки расположены в источнике html следующим образом:

<div class="activity-card-image container">                                                                                                         
<img class="" data-src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg" data-role="cover" alt="tokio skytreeticket" src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg">                                                                                       

Но после нескольких испытаний это "https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg" никогда не появляется.

Вот мой logi c пока:

for reg in RegionIDArray:
    r = requests.get("https://www.getyourguide.de/-l" +str(reg) +"/")
    soup = BeautifulSoup(r.content, "lxml")


    g_data3 = soup.find_all("div",{"class": "activity-card-image-container"})
    for item in g_data3:
        print(item.get("scr"))

Вывод:

  None
  None
  None
  None

Не могли бы вы, ребята, помочь мне поставить? Любые отзывы приветствуются.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...