У меня есть приблизительно 2000 файлов JSON, которые выглядят (примерно) так:
{
"hist": {
"type": "TH2",
"title": "The Title of the Plot",
"stats": {
"name": "The Title of the Plot",
"entries": 720135.0,
},
"xaxis": {
"title": "The X Axis label",
"first": {
"id": 1,
"value": -3
},
"last": {
"id": 31,
"value": 3
}
},
"yaxis": {
"title": "The X Axis label",
"first": {
"id": 1,
"value": -3.14159
},
"last": {
"id": 32,
"value": 3.14159
}
},
"values": {
"min": 0,
"max": 1434
},
"bins": {
"content": [
[
17,
392,
1185
],
[
14,
424,
1083
],
[
8,
392,
1030
],
[
4,
226,
965
]
]
}
}
}
Больше всего меня интересует значение entries
и content
. content
реального файла JSON может быть матрицей 32x31 или 32x26.
Каждый файл JSON уникально идентифицируется по имени файла.
Я должен выполнить вычисления для содержимого и иметь возможность построить сам контент следующим образом:
matplotlib.pyplot.imshow(json_file['hist']['bins']['content'])
Поскольку файл JSON является вложенным, я не уверен, как сохранить его во фрейме данных pandas
. Я предполагаю, что большинство свойств, кроме contents
, могут быть сглажены, но я не знаю, как сгладить матрицу (переменного размера).
Каким может быть подходящий формат данных для хранения всех 2000 файлов JSON?