Я выполняю задание по склеиванию, и мой набор данных содержит столбец с несколькими пустыми значениями. На момент запуска поискового робота в наборе данных тип данных для столбца обозначен как 'double'.
При замене пустых значений средним значением столбца я не могу вычислить среднее значение, поскольку в нем говорится, что среднее / avg / agg может применяться только к столбцу numeri c.
И при выполнении Typecast в IntegerType или DecimalType
dataframe_temp = dataframe.withColumn("col_1",dataframe["col_1"].cast(IntegerType()))
появляется ошибка как: AnalysisException: "cannot resolve 'CAST(`col_1` AS INT)' due to data type mismatch: cannot cast struct<double:double,string:string> to int;
Однако при ручном удалении пустых значений среднее работает нормально.
Может ли кто-нибудь предложить мне, как заменить пустые значения в столбце средним значением столбца.