У меня есть файл JSON, который содержит следующие закодированные строки:
"sender_name": "Horn\u00c3\u00adkov\u00c3\u00a1",
Я пытаюсь проанализировать этот файл с помощью модуля json
.Однако я не могу правильно декодировать эту строку.
Что я получаю после декодирования JSON с использованием метода .load()
, это 'HornÃ\xadková'
.Вместо этого строка должна быть правильно декодирована как 'Horníková'
.
Я прочитал спецификацию JSON и понимаю, что после \u
должно быть 4 шестнадцатеричных числа, указывающих номер Unicode символа.Но похоже, что в этом файле JSON байты в кодировке UTF-8 хранятся как \u
-последовательности.
Какой это тип кодирования и как правильно его анализировать в Python 3?
Является ли этот тип файла JSON допустимым файлом JSON в соответствии со спецификацией?