В моей таблице 8107 строк.
предположим, я нахожу группу "avg (altitude)" по "стране" в столбце с окном. Я получаю вывод:
avg = ap.withColumn('avg_alt',mean(ap.altitude).over(Window.partitionBy(ap.country)))
o / p: 8107 строк
то же самое со свечой. sql -
select avg(altitude) from table group by country
o / p: 240 строк
Какой вывод правильный?
Должен ли я использовать окно или обычный sql?
Оба технически верны, но окно дает для каждой строки