Как исправить неправильный UTF-символ в строке присваивания? - PullRequest
0 голосов
/ 08 апреля 2019

У меня есть цикл python3.6, который выполняет следующее:

childrenList = []

output["text"] = path

for item in sorted(os.listdir(path)):
    contentFullPath = os.path.join(path, item)
    children = {}

    if os.path.isfile(contentFullPath):
        print("item = "+str(item))
        children["text"] = item
        print("children = "+str(children))
        children["id"] = contentFullPath
        childrenList.append(children)

Я получаю следующий вывод:

web_1     | item = Obamaééé.mp4
web_1     | children = {'icon': 'jstree-file', 'text': 
            'Obamae\udccc\udc81e\udccc\udc81e\udccc\udc81.mp4'}

Почему текст из переменной с именем children notправильно отображается?

1 Ответ

0 голосов
/ 08 апреля 2019
import unidecode

text = 'Obamaééé.mp4'
strip_text = unidecode.unidecode(text.decode('utf-8'))
print(strip_text)

[output] : Obamaeee.mp4

Надеюсь, это поможет вам.

...