У меня есть фрейм данных pyspark с некоторыми значениями NULL, и я хочу заменить их случайной датой в заданном диапазоне (с 2015-01-01 по 2019-01-01).
Я попытался сгенерировать случайные числа и соединить их, и получаю случайное значение. Однако все значения NULL заменяются одинаковыми случайными значениями.
data.withColumn('birth_date',when(F.col('birth_date').isNull(),(str(randint(2015,2019))+"-"+str(randint(1,12))+"-"+str(randint(1,31)))).otherwise(F.col('birth_date'))
Как бы я заполнил отдельную случайную дату для каждого нулевого значения?