Я хотел бы объединить записи, которые имеют идентичный идентификационный номер. Например, предположим, у меня есть этот DataFrame:
df=pd.DataFrame({'id': [1, 2, 2, 4], 'animal': ['dog', 'cat', 'bear', 'mouse']})
# just rearranging the order a bit
df=df[['id', 'animal', 'name']]
id animal name
1 dog john
2 cat mary
2 bear mary
4 mouse joe
То, что я хотел бы закончить, это способ получить следующее:
id name animal more_animals
1 john dog NaN
2 mary cat bear
4 joe mouse NaN
Я мог бы использовать df[df.duplicated('id', 'last')]
, чтобы найти дублирующиеся строки, затем пройтись по каждому дублированному идентификатору и добавить детали в новый столбец, но задавался вопросом, было ли что-то более элегантное.
Что-нибудь приходит на ум?