У меня есть df
с одним столбцом type
, и у меня есть два списка
women = ['0980981', '0987098']
men = ['1234567', '4567854']
, теперь я хочу добавить другой столбец на основе значения столбца type
, например:
from pyspark.sql import functions as psf
df_ = df.withColumn('new_col', psf.when(psf.col('type') == 'men', men).when(psf.col('type') == 'women', women))
Но я думаю, что мы не можем вставить список напрямую, как мы можем вставить Array('1234567', '4567854')
в Scala.Я тоже попробовал psf.lit(men)
, но не повезло.
Есть идеи, как это сделать?