Мне нужна помощь для преобразования приведенного ниже кода в код Pyspark или Pyspark sql.
df["full_name"] = df.apply(lambda x: "_".join(sorted((x["first"], x["last"]))), axis=1)
В основном добавляется одно новое имя столбца full_name , которое приходится конкатенировать значения столбцов первым и последним в отсортированном виде.
Я сделал код ниже, но не знаю, как применить для сортировки в текстовом значении столбцов.
df= df.withColumn('full_name', f.concat(f.col('first'),f.lit('_'), f.col('last')))