Обход CAPTCHA с Headless Chrome с использованием кукловода - PullRequest
0 голосов
/ 14 апреля 2019

google обнаруживает, что мой браузер работает на manipulated/controlled/automated программно, и из-за этого я получаю captchas. Я запускаю хром вручную и делаю те же шаги, что и капча не появляется.

Question 1)

Можно ли решить капчу программно или избавиться от нее при использовании puppeteer? Есть ли способ решить эту проблему?

Question 2)

Это происходит только тогда, когда без headless опция i.e

const browser = await puppeteer.launch({
  headless: false
})

ИЛИ это то, что мы должны принять и двигаться дальше?

Ответы [ 2 ]

2 голосов
/ 16 апреля 2019

Попробуйте сгенерировать случайный пользовательский агент, используя этот пакет npm .Обычно это решает защиту на основе агента пользователя.

На страницах кукловода можно переопределить пользовательский агент браузера с помощью page.setUserAgent

var randomUseragent = require('random-useragent');
...
await page.setUserAgent(randomUseragent.getRandom())

Кроме того, вы можете добавить эти два дополнительных плагина,

puppeteer-extra-plugin-recaptcha - Автоматически решает reCAPTCHA, используя одну строку кода: page.solveRecaptchas()

puppeteer-extra-plugin-stealth - Применяет различные техники уклонения, чтобы затруднить обнаружение кукловода без головы.

1 голос
/ 15 апреля 2019

Вы пытались настроить агент браузера?

await page.setUserAgent('5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36');
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...