Как я могу кодировать элемент urllib - PullRequest
0 голосов
/ 14 февраля 2020

Я прочитал ответ о том, как вам нужно .encode("utf-8") для рендеринга на других языках, но я не уверен, где поместить его в этот код:

a = urlopen(url).encode("utf-8")
soup_obj = soup(a,"html.parser")
print(soup_obj.encode("utf-8"))

1 Ответ

0 голосов
/ 14 февраля 2020

После прочтения код выглядит следующим образом.

a = urlopen(url).read().decode("utf-8")
soup_obj = soup(a,"html.parser")

Рекомендуется еще два способа. Вам не нужно беспокоиться о языках.

import requests
a = requests.get(url).text

from simplified_scrapy.request import req
a = req.get(url)
...