Я хочу создать столбец с именем "id", который будет иметь номера строк, которые будут использоваться в окончательной генерации пары. столбец "id"
Я сделал это на python, используя следующий способ. Может кто-нибудь подсказать, как это сделать в pyspark.
con_2['id'] = range(1, 1+len(con_2))
len(con_2.customer_play_id.unique())
Код моего Pyspark указан ниже, но он не работает
from pyspark.sql.types import IntegerType
slen = udf(lambda s: len(s), IntegerType())
con_2 = con_2.withColumn('id', F.length(con_2.customer_play_id))
ожидаемый результат должен быть (Id - столбец, который я хочу добавить)
ДФ
id col1 col2
1 X Y
2 y1 y4
3 y2 y7
4 y3 y8