Я хочу создать столбец со случайными числами вроде этого:
df=df.withColumn("random_col",random.randint(100000, 1000000))
Вышеупомянутое дает мне ошибку:
AssertionError: столбец должен быть Column
Сначала я хотел бы убедиться, что вы импортировали правильный материал ...
Попробуйте импортировать: from pyspark. sql .functions import rand
А затем попробуйте что-то вроде этой строки code:
df1 = df.withColumn ("random_col", rand ()> 100000, 1000000)
Вы также можете проверить этот ресурс. Похоже, это может быть полезно для того, что вы делаете
Надеюсь, это поможет!