Я хочу преобразовать приведенный ниже код SAS в PySpark:
SAS:
proc rank data = INP(where = (col= 1))
out = RESULT groups = 3 descending ;
var Col1
Col2
Col3
Col4;
ranks R_Col1 F_Col2 M_Col3 O_Col4 ;
run ;
Я пытаюсь выполнить вышеуказанное, используя приведенный ниже код PySpark, но получаю ошибку, что объект DataFrame не имеет атрибута 'apply' PySpark:
def grouping(data):
dec=pd.qcut(data['Col1','Col2','Col3','Col4'],3,labels=False)
data['ranks']=dec
return data
RESULT =INP.apply(grouping)
Буду признателен за любую помощь в этом!
Спасибо