Проблема агента пользователя делает нечитаемые теги HTML исходными данными - PullRequest
3 голосов
/ 11 мая 2019

Открытие после проверки кода URL в Chrome выдает следующее сообщение:

Отказался устанавливать небезопасный заголовок «Пользователь-агент»

И код сайта выглядит так:

<div dir="auto" class="rn-13yce4e rn-fnigne rn-ndvcnb rn-gxnn5r rn-deolkf rn-cme181 rn-1471scf rn-14xgk7a rn-1b43r93 rn-o11vmf rn-ebii48 rn-vw2c0b rn-t9a87b rn-1mnahxq rn-61z16t rn-p1pxzi rn-11wrixw rn-wk8lta rn-9aemit rn-1mdbw0j rn-gy4na3 rn-bauka4 rn-q42fyq rn-qvutc0">24 Count</div>

Открытие той же ссылки в Internet Explorer, по-видимому, правильно отображает теги, например: gbcvs-c-addToCart__inner можно найти.

Селен используется для чтения страницы и используется для работы с Chrome. Есть ли способ установить пользовательский агент, зная, что программа будет работать в Linux?

Я попробовал следующее без удачи ..

options = webdriver.ChromeOptions()
options.add_argument('--user-agent="Mozilla/5.0 (Windows NT 6.3; Trident/7.0; rv:11.0) like Gecko"')

Я бы хотел продолжить использовать драйвер Chrome.

1 Ответ

0 голосов
/ 20 мая 2019

Не существует универсального способа сделать это, но для chrome вы можете использовать плагин типа этот , чтобы подделать заголовок вашего пользовательского агента. При использовании Chrome из Selenium вы можете загрузить это расширение и использовать его для изменения этого заголовка для всех запросов.

...