Как преобразовать символы упрощенного китайского языка в html escape-символы с помощью Python? - PullRequest
0 голосов
/ 24 января 2019

Я хочу получить экранирующие символы html из упрощенного китайского (GB18030).

Я пытался использовать библиотеку Python html.escape, но она не работает.

Например, от 宁波 до %C4%FE%B2%A8 и 江北 до %BD%AD%B1%B1.

Как решить эту проблему?

Спасибо.

1 Ответ

0 голосов
/ 24 января 2019
import urllib
urllib.parse.quote('宁波', encoding='GB18030') == '%C4%FE%B2%A8'#True
urllib.parse.quote('江北', encoding='GB18030') == '%BD%AD%B1%B1'#True
...