Python селен предотвращает блокировку сайта - PullRequest
1 голос
/ 07 апреля 2020

На самом деле я не имею в виду проект, просто пытаюсь разобраться, когда я начал задаваться вопросом, как я могу помешать сайту узнать, что я посещал их неоднократно.

Я понятия не имел, как использовать селен, и именно поэтому было много попыток и ошибок - вдруг сайт заблокировал меня. Я включил protonvpn (бесплатно), но он все равно не позволил мне попасть на этот сайт. Я читал о фальшивых пользовательских агентах на chrome и Прокси и всех подобных вещах, но в чем ключ? Что мне нужно сделать перед вторым входом, чтобы никто не узнал, что это снова я?

Достаточно ли изменить мой IP-адрес? Это путь к go? Я не нахожу подходящего ответа python

1 Ответ

1 голос
/ 08 апреля 2020

Проблема здесь звучит так: «1001 *

  1. * 1004» * На многих сайтах есть методы обнаружения пользовательских агентов, которые идентифицируют инструменты автоматизации, например, Selenium.
  2. Быстрое выполнение действий против веб-сайта часто отключает средства обнаружения ботов, а также является опрометчивым. Как правило, если вы не уверены в том, какие системы защиты от ботов или спама существуют, вы хотите настроить скребок так, чтобы время выполнения действий, аналогичное человеческому, было.

Лучше всего проверить пользовательский агент селена и настроить его на что-то другое согласно этому сообщению здесь .

...