Я хочу получить экранирующие символы html из упрощенного китайского (GB18030).
Я пытался использовать библиотеку Python html.escape, но она не работает.
html.escape
Например, от 宁波 до %C4%FE%B2%A8 и 江北 до %BD%AD%B1%B1.
宁波
%C4%FE%B2%A8
江北
%BD%AD%B1%B1
Как решить эту проблему?
Спасибо.
import urllib urllib.parse.quote('宁波', encoding='GB18030') == '%C4%FE%B2%A8'#True urllib.parse.quote('江北', encoding='GB18030') == '%BD%AD%B1%B1'#True