Python Web-scraping charmap, отлично работает в IDLE, а не в ATOM IDE?Зачем? - PullRequest
0 голосов
/ 26 сентября 2018

При выполнении простого запроса на чтение url из python.Я столкнулся со следующей проблемой в своей Atom IDE, но во время простоя я не получил ошибку, в чем может быть причина.Ниже приведен код.

from urllib.request import urlopen
html = urlopen("https://morvanzhou.github.io/static/scraping/basic-structure.html").read().decode('utf-8')
print(html)

Ниже приведена ошибка: enter image description here

1 Ответ

0 голосов
/ 26 сентября 2018

Скорее всего, это происходит потому, что терминал Atom ожидает кодировку, в то время как python кодирует этот html в другую кодировку.Используете ли вы Atom в Windows?

Чтобы решить эту проблему, попробуйте либо настроить терминал Atom для кодирования вашей системы, либо кодировать html в utf8:

from urllib.request import urlopen
html = urlopen("https://morvanzhou.github.io/static/scraping/basic-structure.html").read().decode('utf-8')
print(html.encode('utf-8'))
...