Я знаю, что это, вероятно, идет вразрез с вычислительной логикой c, но есть ли способ использовать percent_rank()
без использования over window
для вычисления процентиля столбца в кадре данных pyspark? GroupBy
не работает. Я пытаюсь избежать окон, так как я не хочу, чтобы весь мой фрейм данных был объединен в один узел. Спасибо