Я пытаюсь проанализировать DataFrame, который содержит Date в качестве индекса и Name и Message в качестве столбцов.
df.head () возвращает:
Name Message
Date
2020-01-01 Tom image omitted
2020-01-01 Michael image omitted
2020-01-02 James image Happy new year you wonderfully awfully people...
2020-01-02 James I was waiting for you image
2020-01-02 James QB whisperer image
Это сводная таблица, которую я пытался отозвать из исходного df, который aggfun c является подсчетом существования слово (например, изображение)
df_s = df.pivot_table(values='Message',index='Date',columns='Name',aggfunc=(lambda x: x.value_counts()['image']))
, которое в идеале показывалось бы, как пример :
Name Tom Michael James
Date
2020-01-01 1 1 0
2020-01-02 0 0 3
Например, я сделал еще один df. pivot_table с использованием
df_m = df.pivot_table(values='Message',index='Date',columns='Name',aggfunc=lambda x: len(x.unique()))
, который агрегирует на основе количества сообщений в день, и возвращает таблицу в порядке.
Заранее спасибо