Я загрузил данные своего мессенджера Facebook (в вашей учетной записи Facebook перейдите к настройкам , , затем к Ваша информация Facebook , затем Загрузите информацию , затем создайте файл, в котором установлен хотя бы флажок Messages ), чтобы получить классную статистику
Однако существует небольшая проблема с кодировкой. Я не уверен, но похоже, что Facebook использовал плохую кодировку для этих данных. Когда я открываю его в текстовом редакторе, я вижу что-то вроде этого: Rados\u00c5\u0082aw
. Когда я пытаюсь открыть его с помощью Python (UTF-8), я получаю RadosÅ\x82aw
. Однако я должен получить: Radosław
.
Мой скрипт на питоне:
text = open(os.path.join(subdir, file), encoding='utf-8')
conversations.append(json.load(text))
Я попробовал несколько наиболее распространенных кодировок. Пример данных:
{
"sender_name": "Rados\u00c5\u0082aw",
"timestamp": 1524558089,
"content": "No to trzeba ostatnie treningi zrobi\u00c4\u0087 xD",
"type": "Generic"
}