Почему мой селен-браузер не авторизован на сайтах, на которых всегда авторизован firefox? - PullRequest
0 голосов
/ 06 августа 2020

Я пытаюсь очистить сайт, на котором выполняется аутентификация. Когда я использую firefox, я всегда уже авторизован на сайте (даже после перезагрузки) и могу go прямо на страницы.

Когда я открываю селен и говорю ему использовать мой firefox профиль, браузер Selenium не вошел в систему. Затем мне нужно go в течение 4 или 5 минут щелкать изображения, чтобы показать, что я человек. Но если я открою firefox сразу после этого, я все равно буду авторизован - никаких проблем.

Так что я действительно не понимаю, что происходит. Я знаю, что мой профиль firefox загружается: когда я инициализирую браузер, копирование профиля занимает около 60 секунд, прежде чем браузер откроется. Мой код ниже:

    from selenium.webdriver import Firefox
    from selenium import webdriver

    url_start = 'https://authenticatedsection.some site.com/'

    fp = webdriver.FirefoxProfile('C:/Users/Claudia/AppData/Roaming/Mozilla/Firefox/Profile/minvococ.default-release')
    browser = Firefox(fp)

    #initialize browser
    browser.get(url_start)

1 Ответ

0 голосов
/ 06 августа 2020

Вы вошли в систему из-за файлов cookie, хранящихся в вашем firefox браузере. Selenium открывает новый процесс браузера без файлов cookie. Если вам нужно только ввести имя пользователя и пароль для входа в систему, это можно сделать с помощью селена. Если вам нужно пройти «человеческий тест» (captcha), такой как задача щелчка по картинке, которую вы описываете, это нельзя сделать с помощью скребка: он специально разработан для предотвращения входа ботов на эту страницу. Почему вы хотите, чтобы ваш парсер входил в ваш профиль firefox?

...