Рассмотрим следующий фрейм данных:
sample_DF.tsv
Я хочу сгруппировать этот фрейм данных, поэтому я применил следующую логику:
df = pd.read_csv('sample_DF.tsv',sep='\t')
df.groupby('col3',as_index=False).aggregate(lambda x:list(x)).reset_index(drop=True)
Но выходные данные не объединяются в списки как список списков для столбцов 4 и 5.
Когда я пытался сделать то же самое с фиктивным кадром данных, например:
df = pd.DataFrame({'P':[['a','b','c'],['x','y'],[1,2,3],['a','b','c'],['x','y']],'Q':['tom','dick','harry','tom','dick'],'R':[10,12,15,10,12]})
df.groupby('R',as_index=False).aggregate(lambda x:list(x))
Я получаю желаемый результат, когда списки списков возвращаются для столбцов P и Q.
Это означает, что в данных sample_DF.tsv есть что-то своеобразное, что приводит к особому поведению моегокоманда pandas.groupby.
Пожалуйста, дайте мне знать, в чем может быть причина.