рассчитать процентиль с помощью pyspark без использования окна - PullRequest
0 голосов
/ 01 мая 2020

Я знаю, что это, вероятно, идет вразрез с вычислительной логикой c, но есть ли способ использовать percent_rank() без использования over window для вычисления процентиля столбца в кадре данных pyspark? GroupBy не работает. Я пытаюсь избежать окон, так как я не хочу, чтобы весь мой фрейм данных был объединен в один узел. Спасибо

...