Как разобрать вьетнамские символы юникода в тексте - PullRequest
0 голосов
/ 27 августа 2018

Как использовать Python для декодирования

[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh

в это

[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh

Спасибо.


Я пробовал следующий код из вышеупомянутых предположенийнить:

import re, HTMLParser
title="[Hài kịch] Vợ ơi là vợ - Vân Sơn Bảo Liêm & Lê Huỳnh"
list_of_html = re.findall("&.+?;", title) 
for e in list_of_html:
    h = HTMLParser.HTMLParser()
    unescaped = h.unescape(e)
    title = title.replace(e, unescaped)
print title

, но получил сообщение об ошибке:

Unsupported characters in input 

, потому что у меня есть эти слова в названии "kịch Vợ ơi vợ - Sơn Bảo Huỳnh".Как я могу это исправить?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...