Как преодолеть механизм обнаружения ботов некоторых сайтов? - PullRequest
0 голосов
/ 14 апреля 2020

В настоящее время я пытаюсь получить некоторую информацию с веб-сайта Alibaba, преодолеть такие вещи - все равно, что идти в ад.

Вот веб-страница: lazada.sg А вот и сообщение о блокировке: https://pasteboard.co/J3MUL46.png Вы можете попробовать его, выполнив поиск по некоторым фразам, а затем удалите файлы cookie, а затем go на стр. 2. В настоящее время я использую Selenium для получения файлов cookie, чтобы в дальнейшем запрос мог использовать его для «легального» доступа. веб-страница.

Первый - с файлами cookie: эти вещи легко и могут быть преодолены с помощью Selenium

Второй - как имитировать человеческий слайд этой "капчи": ее ' очень трудно, так как Selenium не предоставляет никаких инструментов для имитации человека-маневра.

А также попробуйте с браузером без головы: это не так.

Вот мой пример кода, вы должны заблокируйте себя перед запуском: https://gist.github.com/taidinh-tiki/5f997b92431c0c1eaff1459f782ca55c

...