Я пользователь python / pandas и у меня есть вопрос по этому поводу.У меня есть файл Excel, как показано ниже.
C1 C2 C3 C4 C5 C6 ID Value
0 aa ee ii mm aaaaa bbbb 1 100
1 bb ff jj nn cccc ddddd 2 50
2 aa ee ii mm eeee ffff 3 20
3 dd hh ll pp gggg hhhh 4 10
4 aa ee ii mm abcd efgh 5 5
5 bb ff jj nn aaaaa bbbb 6 2
Код для воспроизведения -
df = pd.DataFrame({'Value': [100,50,20,10,5,2],
'ID': [1,2,3,4,5,6],
'C1': ['aa','bb','aa','dd','aa','bb'],
'C2': ['ee','ff','ee','hh','ee','ff'],
'C3': ['ii','jj','ii','ll','ii','jj'],
'C4': ['mm','nn','mm','pp','mm','nn'],
'C5': ['aaaaa','cccc','eeee','gggg','abcd','aaaaa'],
'C6': ['bbbb','ddddd','ffff','hhhh','efgh','bbbb']})
Некоторые строки являются дубликатами в столбце 1-4 (например, ID1, ID3и ID5 или ID2 и ID6 являются дубликатами).Есть ли способ объединить дубликаты строк?(Я сосредотачиваюсь на столбце 1-4, и меня не волнуют столбцы 5 и 6)
Я хочу объединить «Значение» дублирующихся строк и оставить последовательность верхнего столбца.Например, вот выходной файл, который я хочу создать.
Value ID C1 C2 C3 C4 C5 C6
0 125 1 aa ee ii mm aaaaa bbbb
1 52 2 bb ff jj nn cccc ddddd
2 10 4 dd hh ll pp gggg hhhh
Если бы вы могли высказать свое мнение, я был бы очень благодарен за это.