У меня есть столбец с оценками, и я хочу создать столбец групп для этой оценки.
Пример: счет 623 должен иметь столбец со значением (600, 625]
.
В Python я делал это так:
df['score_band_25'] = df['score'].apply(lambda x: '('+str((int((x-0.1)//25)*25))+', '+str(int((x-0.1)//25)*25+25)+']')
Как я могу сделать это в Scala? Лучшее, что я мог придумать, было:
.withColumn("score_band_25", floor(($"score"-0.1)/25)*25)
но это дает мне только первую часть кортежа, и я не могу найти способ объединить floor(($"score"-0.1)/25)*25)
и floor(($"score"-0.1)/25)*25+25)
в строки.
В идеале я хотел бы, чтобы в начале у меня было (
, а в конце - ]
, но я был бы рад и двум (600, 625)
.