Используя pysparks и работая с некоторыми данными о визге, я пытаюсь подсчитать тех, кто является элитными членами, и тех, кто этого не делает.
df_Usr2.groupby(['name', 'business_id', 'Elite_Member']).count().sort('business_id', acending=True).show(50, truncate=False)
Когда я создаю счет прямо сейчас, он отображает их сверху вниз, как показано ниже, я пытался показать их рядом, с .withColumn, у которого был счетдля None Elites.
В настоящее время это так:
[name] [Business_id] [EliteMem] [Count]
a 123 No 5
a 123 Yes 10
Я надеялся на что-то более похожее на это:
[name] [Business_id] [EliteMem] [NonEliteMem]
a 123 10 5
Вот этоПосмотрите, как выглядит мой фрейм данных