Я пишу программу, которая может собирать информацию об альбомах из музыкальной базы данных Discogs. Скребок работает отлично.
Теперь у меня есть фрейм данных с множеством дублированных исполнителей и названий, в которых отличается только ячейка форматов (см., Например, «Sido», «Ich und keine Maske» в фрагменте моегорамка данных ниже).
Interpret Title Formats
0 Afrika Bambaataa And Family The Decade Of Darkness 1990-2000 CD, Album, RE
1 Sha Hef Out The Mud
2 Sido Ich Und Keine Maske CD, Album
3 Sido Ich Und Keine Maske 2xLP, Album
...
Теперь я ищу способ объединить эти двойные записи без потери информации. Может кто-нибудь дать мне подсказку? Окончательный результат должен выглядеть следующим образом:
Interpret Title Formats
0 Afrika Bambaataa And Family The Decade Of Darkness 1990-2000 CD, Album, RE
1 Sha Hef Out The Mud
2 Sido Ich Und Keine Maske CD, Album, 2xLP
...
Я пытался
r = dataframe.groupby('Interpret')['Formate'].apply(','.join)
, но в результате получился ряд Панд с удаленным столбцом заголовка, поэтому я потерял информацию.