Добавление столбца со случайными числами в пределах диапазона в pyspark - PullRequest
0 голосов
/ 08 мая 2020

Я хочу создать столбец со случайными числами вроде этого:

df=df.withColumn("random_col",random.randint(100000, 1000000))

Вышеупомянутое дает мне ошибку:

AssertionError: столбец должен быть Column

1 Ответ

0 голосов
/ 08 мая 2020

Сначала я хотел бы убедиться, что вы импортировали правильный материал ...

Попробуйте импортировать: from pyspark. sql .functions import rand

А затем попробуйте что-то вроде этой строки code:

df1 = df.withColumn ("random_col", rand ()> 100000, 1000000)

Вы также можете проверить этот ресурс. Похоже, это может быть полезно для того, что вы делаете

Надеюсь, это поможет!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...