Как я могу создать два уровня вложенных JSON в Python? - PullRequest
0 голосов
/ 10 марта 2019

Я новичок, копался 4 дня и не могу найти ответ на вопрос, что мне нужно.

мои данные выглядят так

ENTITY,MEASUREMENT_DATE,CHART_VALUE,PARAM
143,2019/03/08 10:21:21 PM,0.047353,param1
143,2019/03/08 10:21:21 PM,40.25,param2
160,2019/03/08 10:57:18 AM,0.066874,param1
160,2019/03/06 4:24:31 PM,38,param2
143,2019/03/06 10:00:41 PM,0.01707,param1
143,2019/03/09 1:04:32 AM,35.25,param2
160,2019/03/06 4:24:31 PM,0.048042,param1
143,2019/03/07 12:09:38 AM,0,param1
160,2019/03/08 10:57:18 AM,42.25,param2
143,2019/03/09 1:04:32 AM,0.012104,param1
143,2019/03/06 10:00:41 PM,41.75,param2
143,2019/03/07 12:09:38 AM,36.5,param2

и желаемый результат должен выглядеть следующим образом:

{
    "143": {
        "param1": {
            "MEASUREMENT_DATE": 
            "CHART_VALUE":
         }, 
         "param2": {
           "MEASUREMENT_DATE": 
            "CHART_VALUE": 
         },
     },
     "160": {
        "param1": {
            "MEASUREMENT_DATE": 
            "CHART_VALUE":
         }, 
         "param2": {
           "MEASUREMENT_DATE": 
            "CHART_VALUE": 
         },
     }, 
}

Я попробовал этот код, но для начала я все еще не получаю список, сгруппированный по параметру:

with open('file.csv') as csvfile:
    r = DictReader(csvfile, skipinitialspace=True)
    data = [dict(d) for d in r]

    groups = []
    uniquekeys = []

    for k, g in groupby(data, lambda r: ( r['PARAM'])):
        groups.append({
            "group": k,
            "user": [{k: v for k, v in d.items() if k not in ['PARAM']} for d in list(g)]
        })
        uniquekeys.append(k)

спасибо заранее !!

1 Ответ

0 голосов
/ 10 марта 2019

У вас есть фундаментальная проблема, когда вы не можете использовать структуру словаря в вашем примере.

Например, у вас есть две строки с «143» и «param1».Словарь не может содержать несколько значений в одном ключе.Это оставляет два варианта (я думаю).Либо вы хотите сохранить массив результатов в каждом местоположении, либо вы хотите иметь способ выбрать одно значение для сохранения в этом ключе (например, самое последнее значение по дате).

Тем не менее, это должно дать вамначалось.Это решение, в котором вы храните все значения для ключа:

from __future__ import print_function
from pprint import pformat
import csv
try:
  from io import StringIO
except:
  from StringIO import StringIO


data = '''ENTITY,MEASUREMENT_DATE,CHART_VALUE,PARAM
143,2019/03/08 10:21:21 PM,0.047353,param1
143,2019/03/08 10:21:21 PM,40.25,param2
160,2019/03/08 10:57:18 AM,0.066874,param1
160,2019/03/06 4:24:31 PM,38,param2
143,2019/03/06 10:00:41 PM,0.01707,param1
143,2019/03/09 1:04:32 AM,35.25,param2
160,2019/03/06 4:24:31 PM,0.048042,param1
143,2019/03/07 12:09:38 AM,0,param1
160,2019/03/08 10:57:18 AM,42.25,param2
143,2019/03/09 1:04:32 AM,0.012104,param1
143,2019/03/06 10:00:41 PM,41.75,param2
143,2019/03/07 12:09:38 AM,36.5,param2
'''

class JsonBuilder(object):
  def __init__(self):
    self.result = {}

  def ingest_row(self, row):
    primary_key, mdate, value, param = row
    if primary_key not in self.result:
      self.result[primary_key] = {}

    if param not in self.result[primary_key]:
      self.result[primary_key][param] = []

    self.result[primary_key][param].append({ 
        "MEASUREMENT_DATE": mdate,
         "CHART_VALUE": value })
  def __str__(self):
    return pformat(self.result)

builder = JsonBuilder()
reader = csv.reader(StringIO(data))
next(reader, None) #skip header
for row in reader:
 builder.ingest_row(row)
print(builder)

Выход:

{'143': {'param1': [{'CHART_VALUE': '0.047353',
                     'MEASUREMENT_DATE': '2019/03/08 10:21:21 PM'},
                    {'CHART_VALUE': '0.01707',
                     'MEASUREMENT_DATE': '2019/03/06 10:00:41 PM'},
                    {'CHART_VALUE': '0',
                     'MEASUREMENT_DATE': '2019/03/07 12:09:38 AM'},
                    {'CHART_VALUE': '0.012104',
                     'MEASUREMENT_DATE': '2019/03/09 1:04:32 AM'}],
         'param2': [{'CHART_VALUE': '40.25',
                     'MEASUREMENT_DATE': '2019/03/08 10:21:21 PM'},
                    {'CHART_VALUE': '35.25',
                     'MEASUREMENT_DATE': '2019/03/09 1:04:32 AM'},
                    {'CHART_VALUE': '41.75',
                     'MEASUREMENT_DATE': '2019/03/06 10:00:41 PM'},
                    {'CHART_VALUE': '36.5',
                     'MEASUREMENT_DATE': '2019/03/07 12:09:38 AM'}]},
 '160': {'param1': [{'CHART_VALUE': '0.066874',
                     'MEASUREMENT_DATE': '2019/03/08 10:57:18 AM'},
                    {'CHART_VALUE': '0.048042',
                     'MEASUREMENT_DATE': '2019/03/06 4:24:31 PM'}],
         'param2': [{'CHART_VALUE': '38',
                     'MEASUREMENT_DATE': '2019/03/06 4:24:31 PM'},
                    {'CHART_VALUE': '42.25',
                     'MEASUREMENT_DATE': '2019/03/08 10:57:18 AM'}]}}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...