Как преобразовать DataFrame во вложенный словарь с одинаковыми столбцами в дочерних и родительских элементах - PullRequest
0 голосов
/ 17 марта 2020

У меня есть следующий фрейм данных.

dictdata={'id':[991,992,989,5,4],'parentid':[4,4,4,0,0],'pcid': ['4_2','4_3','4_1','5','4']}
df = pd.DataFrame(dictdata)


   id   parentid  pcid
0  991         4  4_2
1  992         4  4_3
2  989         4  4_1
3    5         0    5
4    4         0    4

column id является родительским столбцом, а parentid представляет отношение внутри id (строки)

Я хочу сгенерировать словарь из приведенного выше кадра данных следующим образом:

{'data': [{'id': '5', 'level': 0, 'parentid': 0, 'pcid': '5', 'children': []},
          {'id': '4',
           'level': 0,
           'parentid': 0,
           'pcid': '4',
           'children': [{'id': '991',
                         'level': 2, 
                         'parentid': 4, 
                         'pcid': '4_2'
                        },
                        {'id': '992',
                         'level': 3,
                         'parentid': 4,
                         'pcid': '4_3'
                        },
                       {'id': '989', 
                        'level': 1, 
                        'parentid': 4,
                        'pcid': '4_1'
                       }
          ]}
        ]}

Ответы [ 3 ]

2 голосов
/ 17 марта 2020
from collections import defaultdict

d = defaultdict(dict)
for _, (i, parentid, pcid) in df.iterrows():
    d[i]['parentid'] = parentid
    d[i]['pcid'] = pcid

    level = 0
    if '_' in pcid:
        _, level = pcid.split('_')
    d[i]['level'] = level

result = {}
for k, v in d.items():
    if v['parentid'] not in d:
        result[k] = {'id': k, **v, 'children':[]}

for k, v in d.items():
    if v['parentid'] in d:
        result[v['parentid']]['children'].append({'id': k, **v})

result

вывод:

{5: {'id': 5, 'parentid': 0, 'pcid': '5', 'level': 0, 'children': []},
 4: {'id': 4,
  'parentid': 0,
  'pcid': '4',
  'level': 0,
  'children': [{'id': 991, 'parentid': 4, 'pcid': '4_2', 'level': '2'},
   {'id': 992, 'parentid': 4, 'pcid': '4_3', 'level': '3'},
   {'id': 989, 'parentid': 4, 'pcid': '4_1', 'level': '1'}]}}
0 голосов
/ 17 марта 2020

попробуйте это может помочь вам

cols = df.columns
d = dict((df.groupby('id')[cols].apply(lambda x: x.to_dict('r'))))
>>d
{4: [{'id': 4, 'parentid': 0, 'pcid': 4}],
 5: [{'id': 5, 'parentid': 0, 'pcid': 5}],
 989: [{'id': 989, 'parentid': 4, 'pcid': '4_1'}],
 991: [{'id': 991, 'parentid': 4, 'pcid': '4_2'}],
 992: [{'id': 992, 'parentid': 4, 'pcid': '4_3'}]}
0 голосов
/ 17 марта 2020

Создание родительского и дочернего фрейма данных из фактического фрейма данных

dfchild = df.loc[~(df['id']==df['pcid'])]
dfparent = df.loc[(df['id']==df['pcid'])] 

преобразовать эти df в dict:

parentdict = dfparent.to_dict('records')
childdict = dfchild.to_dict('records')

итерируйте родительский элемент, и внутри получите соответствующий дочерний элемент от childdict на основе парентиды:

for parentdic in parentdict:
    eleid= int(parentdic['id'])
    childdictva=[]
    for child in childdict:
        childele=int(float(child['parentid']))
        if childele==eleid:
            childdictva.append(child)
    parentdic['children']=childdictva

Окончательный код:

df['id']=df['id'].apply(str)
dfchild = df.loc[~(df['id']==df['pcid'])]
dfparent = df.loc[(df['id']==df['pcid'])]   
data = {}
parentdict = dfparent.to_dict('records')
childdict = dfchild.to_dict('records')
for parentdic in parentdict:
    eleid= int(parentdic['id'])
    childdictva=[]
    for child in childdict:
        childele=int(float(child['parentid']))
        if childele==eleid:
            childdictva.append(child)
    parentdic['children']=childdictva
data["data"] = parentdict

parentdict
{'data': [{'id': '5', 'level': 0, 'parentid': 0, 'pcid': '5', 'children': []},
 {'id': '4',
 'level': 0,
 'parentid': 0,
 'pcid': '4',
 'children': [{'id': '991', 'level': 2, 'parentid': 4, 'pcid': '4_2'},
  {'id': '992', 'level': 3, 'parentid': 4, 'pcid': '4_3'},
  {'id': '989', 'level': 1, 'parentid': 4, 'pcid': '4_1'}]}]}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...