ввод: -
print(df)
device_id ids
025c08d535a074b4 [8972]
025c08d535a074b4 [10595, 10595]
02612734f96edc43 [10016, 8795, 10019, 8791, 8351, 8791]
02612734f96edc43 [10016, 8795, 10019, 8791, 8351, 10052, 8345]
должен выводить уникальный список идентификаторов для каждого device_d, например:
device_id ids
025c08d535a074b4 [8972,10595]
02612734f96edc43 [10016, 8795, 10019,8791,8351,10052, 8345]
Я пытаюсь сделать это, используя: ->
df=pd.DataFrame(df.groupby('device_id')['ids'].apply(set))
, но он не работает должным образом, добавляет '
для идентификаторов перед идентификаторами и возвращает список, как.
device_id ids
025c08d535a074b4 [8972,'10595, 10595]
02612734f96edc43 ['10016,8795,10019,8791,8351,8791,'10016]