Python объединить фрейм данных и словарь словаря списка - PullRequest
2 голосов
/ 16 января 2020

Фрейм данных выглядит следующим образом:

d = {'ID': [1, 2,3],'V':['F','G','H'],'AAA':[0,1,1],'AA':[0,2,2],'A':[0,3,3],'BBB':[0,4,4]}
df2 = pd.DataFrame(data=d)

, а словарь выглядит следующим образом:

dct ={1:{'F':[2,3,5],'G':[3,5,6],'H':[6,7,8]},
      2:{'F':[1,3,5],'G':[8,5,6],'H':[9,7,8]},
      3:{'F':[5,3,5],'G':[4,5,6],'H':[10,7,8]}
     }

На основе значений 'ID' и 'V' я могу получить доступ к списку из словаря. то есть dct [2] ['G']. Как я могу применить слияние к этому?

Короче говоря, я хочу добавить определенный список в виде строки в фрейм данных.

Ожидаемый результат должен выглядеть следующим образом:

op_d = {'ID': [1, 2,3],'V':['F','G','H'],'AAA':[0,1,1],'AA':[0,2,2],'A':[0,3,3],'BBB':[0,4,4],'Q1':[2,8,10],'Q2':[3,5,7],'Q3':[5,6,8]}
output_df = pd.DataFrame(data=op_d )

Ответы [ 3 ]

7 голосов
/ 16 января 2020

Используйте df.lookup после создания кадра данных из словаря dct и затем преобразуйте в кадр данных assign:

m = pd.DataFrame(dct).T
s = df2.set_index('ID')['V']
output = df2.assign(**pd.DataFrame(m.lookup(s.index,s).tolist(),columns=['Q1','Q2','Q3']))

print(output)

   ID  V  AAA  AA  A  BBB  Q1  Q2  Q3
0   1  F    0   0  0    0   2   3   5
1   2  G    1   2  3    4   8   5   6
2   3  H    1   2  3    4  10   7   8

Для динамического переименования c используйте:

df2.assign(**pd.DataFrame(m.lookup(s.index,s).tolist()).rename(columns=lambda x:f"Q{x+1}"))

   ID  V  AAA  AA  A  BBB  Q1  Q2  Q3
0   1  F    0   0  0    0   2   3   5
1   2  G    1   2  3    4   8   5   6
2   3  H    1   2  3    4  10   7   8

Или:

df2.assign(**pd.DataFrame(m.lookup(s.index,s).tolist()).add_prefix('Q'))

   ID  V  AAA  AA  A  BBB  Q0  Q1  Q2
0   1  F    0   0  0    0   2   3   5
1   2  G    1   2  3    4   8   5   6
2   3  H    1   2  3    4  10   7   8
5 голосов
/ 16 января 2020

Вы можете превратить ваш dict в DataFrame с MultiIndex, а затем объединить.

d2 = {(k, k2): v2 for k,v in dct.items() for k2,v2 in v.items()}

u = pd.DataFrame(d2.values(), index=d2.keys())
#u = pd.DataFrame(d2).T 
u.columns = [f'Q{i+1}' for i in u.columns]

df2.merge(u, left_on=['ID', 'V'], right_index=True)

#   ID  V  AAA  AA  A  BBB  Q1  Q2  Q3
#0   1  F    0   0  0    0   2   3   5
#1   2  G    1   2  3    4   8   5   6
#2   3  H    1   2  3    4  10   7   8
4 голосов
/ 16 января 2020

мой лучший с DataFrame.lookup.

df2.assign(**pd.DataFrame(dict(enumerate(pd.DataFrame(dct)
                                           .lookup(df2['V'],
                                                   df2['ID']),1)))
               .add_prefix('Q'))

   ID  V  AAA  AA  A  BBB  Q1  Q2  Q3
0   1  F    0   0  0    0   2   8  10
1   2  G    1   2  3    4   3   5   7
2   3  H    1   2  3    4   5   6   8
...