Я использую Python
до scrape
страниц. До сих пор у меня не было никаких проблем. Я использую Selenium
для этой цели, но я также слышал, что людям запрещают использование IP на некоторых сайтах. Я не сталкивался с этим. Эти люди использовали библиотеки beautifulsoup
, lxml
и requests
...
Селен чувствует, что пользователь использует браузер, а не ботов, но может ли он также IP заблокирован с каких сайтов? Я также использую заголовок user_agent как:
user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_3) AppleWebKit/537.36 (KHTML, like Gecko) ' \
'Chrome/80.0.3987.132 Safari/537.36'