Вы имеете в виду, что в вашей аггре вы хотите добавить столбец, который подсчитывает все вхождения для каждого groupBy?
Вы можете добавить это тогда:
.agg(
F.count(F.lit(1)).alias("total_count"),
...
)
Кстати,Я не думаю, что вы вынуждены использовать F.lit (1) .В исходном коде Spark может быть случай совпадения, если вместо F.lit (1)
// Turn count(*) into count(1)
case s: Star => Count(Literal(1))
case _ => Count(e.expr)
So F.count ("*" указана звезда)) также будет работать, я думаю
PS: Я использую F. , потому что я предположил, что вы импортировали пакет функций, напримерэто
from pyspark.sql import functions as F