Кукольник обходит рекапчу и извлекает все куки в режиме без головы - PullRequest
0 голосов
/ 09 октября 2019
const puppeteer = require('puppeteer');
(async () => {
    const browser = await puppeteer.launch({args: ['--no-sandbox']});
    const page = await browser.newPage();

    try {
        await page.goto('https://www.allabout*****.org', {waitUntil: 'networkidle2'}); // 59 second - load - domcontentloaded - networkidle2
        const cookies = await page._client.send('Network.getAllCookies');
        JSON.stringify(cookies, null, 4);

    } catch (e) {

    }
    await browser.close();
})();

Попробовал приведенный выше код для получения всех файлов cookie, но он принимает только файлы cookie перед принятием капчи. После принятия капчи, он также устанавливает куки, которые не попадают в список куки. Как я могу избежать капчи с помощью кукловода в режиме без головы (без заголовка: true)?

Пробовал разные независимые модули узлов, помощники кукловода, ничего не получалось.

1 Ответ

1 голос
/ 09 октября 2019

Я только что попробовал ваш код и понял, что вы использовали {waitUntil: "load"}. Я просто заменил его на {waitUntil: "networkidle2"} и удалил тайм-аут (все еще используется headless:true), и он показал мне CookieScriptConsent в списке файлов cookie.

...