У меня есть данные, которые выглядят так:
user document score
A ABC .98
A BCD .91
A CDE .90
B ABC .68
B XYZ .60
и так далее.
Я хочу сжать / агрегировать это до:
user document score
A 'ABC','BCD','CDE' '.98','0.91','0.90'
B 'ABC','XYZ' '.68','.60'
и т. Д.
Я знаю, как сделать это столбец за столбцом, используя эту формулу:
(df['document'].str.split(', ')
.groupby(df['user'])
.agg(lambda x: ', '.join(set(y for z in x for y in z)))
.reset_index())
но если я попытаюсь сделать это для обоих столбцов, это покажет мне ошибку. Как мне это сделать? Пожалуйста, помогите.