Декодирование из экранированного Unicode в арабский c с использованием Python - PullRequest
0 голосов
/ 19 июня 2020

Я пытался декодировать файл json с экранированным текстом Unicode /uHHH .. исходный текст - Arabi c

. Мои исследования привели меня к следующему коду с использованием python.

s = '\u00d8\u00b5\u00d9\u0088\u00d8\u00b1 \u00d8\u00a7\u00d9\u0084\u00d9\u008a\u00d9\u0088\u00d9\u0085\u00d9\u008a\u00d8\u00a7\u00d8\u00aa'
ouy= s.encode('utf-8').decode('unicode-escape').encode('latin1').decode('utf-8')
print(ouy)

текст результата будет: صÙر اÙÙÙÙÙات который все еще требует некоторого исправления с помощью онлайн-инструмента , чтобы стать исходным текстом: صور اليوميات

Есть ли способ выполнить это исправление с помощью приведенного выше кода? Был бы признателен за вашу помощь, ребята, заранее спасибо

...