Я в настоящее время сканирую веб-страницу (https://www.getyourguide.de/s/?q=tokio&customerSearch=1&searchSource=2), используя Python 3.7 и bs4, чтобы собрать изображения соответствующих действий.
Я обнаружил, что ссылки расположены в источнике html следующим образом:
<div class="activity-card-image container"> <img class="" data-src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg" data-role="cover" alt="tokio skytreeticket" src="https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg">
Но после нескольких испытаний это "https://cdn.getyourguide.com/img/tour_img-1621839-68.jpg" никогда не появляется.
Вот мой logi c пока:
for reg in RegionIDArray: r = requests.get("https://www.getyourguide.de/-l" +str(reg) +"/") soup = BeautifulSoup(r.content, "lxml") g_data3 = soup.find_all("div",{"class": "activity-card-image-container"}) for item in g_data3: print(item.get("scr"))
Вывод:
None None None None
Не могли бы вы, ребята, помочь мне поставить? Любые отзывы приветствуются.