Как создать новый столбец со случайными значениями с плавающей точкой в ​​pyspark? - PullRequest
0 голосов
/ 04 декабря 2018

Я пытался использовать этот код

from pyspark.sql.functions import rand,when
df1 = df.withColumn('isVal', when(rand()0.5,1).otherwise(0.6))

, но этот код генерирует только целое число, я хочу создать число от 1,5 до 2,5, как я могу сделать это в pyspark?

Ответы [ 2 ]

0 голосов
/ 04 декабря 2018

Немного математики - 1.5+rand() будет между [1.5,2.5], потому что maximum значение rand() может быть 1, поэтому 1.5+1=2.5 и minimum равно 0, поэтому 1.5+0=1.5

df = df.withColumn('isVal', 1.5+rand())
0 голосов
/ 04 декабря 2018
from pyspark.sql.functions import rand
df1 = df.withColumn('isVal', 1.5+rand())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...