Формат данных для хранения нескольких вложенных файлов JSON - PullRequest
0 голосов
/ 16 января 2019

У меня есть приблизительно 2000 файлов JSON, которые выглядят (примерно) так:

{
  "hist": {
    "type": "TH2",
    "title": "The Title of the Plot",
    "stats": {
      "name": "The Title of the Plot",
      "entries": 720135.0,
    },
    "xaxis": {
      "title": "The X Axis label",
      "first": {
        "id": 1,
        "value": -3
      },
      "last": {
        "id": 31,
        "value": 3
      }
    },
    "yaxis": {
      "title": "The X Axis label",
      "first": {
        "id": 1,
        "value": -3.14159
      },
      "last": {
        "id": 32,
        "value": 3.14159
      }
    },
    "values": {
      "min": 0,
      "max": 1434
    },
    "bins": {
      "content": [
        [
          17,
          392,
          1185
        ],
        [
          14,
          424,
          1083
        ],
        [
          8,
          392,
          1030
        ],
        [
          4,
          226,
          965
        ]
      ]
    }
  }
}

Больше всего меня интересует значение entries и content. content реального файла JSON может быть матрицей 32x31 или 32x26.

Каждый файл JSON уникально идентифицируется по имени файла.

Я должен выполнить вычисления для содержимого и иметь возможность построить сам контент следующим образом:

matplotlib.pyplot.imshow(json_file['hist']['bins']['content'])

Поскольку файл JSON является вложенным, я не уверен, как сохранить его во фрейме данных pandas. Я предполагаю, что большинство свойств, кроме contents, могут быть сглажены, но я не знаю, как сгладить матрицу (переменного размера).

Каким может быть подходящий формат данных для хранения всех 2000 файлов JSON?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...