Страница с красивыми супами Python Beautiful Soup, содержащая JSP / JS - PullRequest
0 голосов
/ 17 сентября 2018

Я пытаюсь очистить цену с этой страницы: url = https://www.renodepot.com/en/steph-round-base-shower-kit-69375118

информация о цене указана в теге span, и я не могу ее очистить.простой код, который я использую для этого, -

from requests import get
from bs4 import BeautifulSoup
response = get(url)
html_soup = BeautifulSoup(response.text, 'html.parser')
ProductPrice = html_soup.find('div',class_ = 'product_price_wrapper')

, но это ничего не возвращает, я думаю, что

 BEGIN RenoProdDetailPriceSnippet.jsp 

, который появляется чуть выше вкладки деления цены, вызывает защиту информации.

Я даже пытался сделать это с селеном, но безуспешно.Я пробовал много других комбинаций, чтобы получить цену, но не смог получить то же самое.

Итак, я ищу некоторые идеи, чтобы решить эту проблему.Спасибо

1 Ответ

0 голосов
/ 17 сентября 2018

Вы не можете очистить страницу, потому что она требует завершения reCAPTCHA для доступа.Это специально разработано для остановки ботов.

Если вы изучите html_soup, вы обнаружите, что на самом деле вы ищете страницу reCAPTCHA, а не нужную страницу продукта.

...