Question

У меня есть приблизительно 2000 файлов JSON, которые выглядят (примерно) так:

{
  "hist": {
    "type": "TH2",
    "title": "The Title of the Plot",
    "stats": {
      "name": "The Title of the Plot",
      "entries": 720135.0,
    },
    "xaxis": {
      "title": "The X Axis label",
      "first": {
        "id": 1,
        "value": -3
      },
      "last": {
        "id": 31,
        "value": 3
      }
    },
    "yaxis": {
      "title": "The X Axis label",
      "first": {
        "id": 1,
        "value": -3.14159
      },
      "last": {
        "id": 32,
        "value": 3.14159
      }
    },
    "values": {
      "min": 0,
      "max": 1434
    },
    "bins": {
      "content": [
        [
          17,
          392,
          1185
        ],
        [
          14,
          424,
          1083
        ],
        [
          8,
          392,
          1030
        ],
        [
          4,
          226,
          965
        ]
      ]
    }
  }
}

Больше всего меня интересует значение entries и content. content реального файла JSON может быть матрицей 32x31 или 32x26.

Каждый файл JSON уникально идентифицируется по имени файла.

Я должен выполнить вычисления для содержимого и иметь возможность построить сам контент следующим образом:

matplotlib.pyplot.imshow(json_file['hist']['bins']['content'])

Поскольку файл JSON является вложенным, я не уверен, как сохранить его во фрейме данных pandas. Я предполагаю, что большинство свойств, кроме contents, могут быть сглажены, но я не знаю, как сгладить матрицу (переменного размера).

Каким может быть подходящий формат данных для хранения всех 2000 файлов JSON?

Формат данных для хранения нескольких вложенных файлов JSON

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Формат данных для хранения нескольких вложенных файлов JSON

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов