Мой фрейм данных выглядит как -
id gender age
1 m 27
2 m 39
3 f 99
4 f 11
5 m 46
6 f 60
Я хочу, чтобы мой окончательный фрейм данных был похож -
id gender age new_age
1 m 27 27
2 m 39 39
3 f 99 43
4 f 11 43
5 m 46 46
6 f 60 60
Мой код -
from pyspark.sql.functions import mean as _mean, stddev as _stddev, col
condition = ((df['age'] >= 18 & df['age'] <=60))
df = df.withColumn("new_age", when(condition, (col("age"))).otherwise(_mean(col('age')))
, но я хочу среднее значение только 27,39,46 и 60 ... не часть выброса. Как это сделать в pyspark?