Ошибка декодирования драйвера браузера селена на китайском - PullRequest
0 голосов
/ 29 апреля 2019

из-за китайского, браузер декодирует ошибку источника страницы, и я не могу декодировать до нужного контента с помощью Python введите описание изображения здесь

но для браузера он отображается правильно ...

как мне декодировать источник страницы, чтобы получить нужный контент?

URL-адрес API URL страницы

вот мой код:


from selenium import webdriver

driver = webdriver.Chrome("/home/ug/Desktop/bin/chromedriver")

# the url is the `api url`       
driver.get("http://data.stats.gov.cn/easyquery.htm?m=QueryData&dbcode=fsjd&rowcode=zb&colcode=sj&wds=%5B%7B%22wdcode%22%3A%22reg%22%2C%22valuecode%22%3A%22350000%22%7D%5D&dfwds=%5B%5D&k1=1555920886106")

driver.page_source

1 Ответ

0 голосов
/ 30 апреля 2019

Я решаю эту проблему, выполняя javascript.

сначала я использую driver.get("http://data.stats.gov.cn"), затем driver.execute_script('$.ajax...') и задаю возврат в качестве содержимого страницы,

сейчас, страницуисходный код был правильно декодирован ...

Я думаю, что AJAX работал

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...