Мне нужна помощь по методам агрегирования, использующим искру с использованием фреймов данных.Используя spark sql, я могу легко сгенерировать агрегацию, но как эффективно выполнять множественное агрегирование с использованием фреймов данных.То, что я ищу, это:
- Получить Total-count, эквивалентный count (*).
Уникальный счет какого-то определенного поля.Например: select col1, col2, col3, count(*), countDistinct(col1,col2)
Получите первое посещение.
Количество col, замеченных только в группе.
select col1, col2, col3, count(col3 not seen before{i.e. it's primary to particular set of columns})