Как найти среднее значение для набора столбцов в строке информационного кадра pyspark и добавить его в качестве другого столбца в тот же информационный кадр? - PullRequest
0 голосов
/ 19 сентября 2018

У меня есть DataFrame, состоящий из 500 столбцов, из которых для каждой строки мне нужно получить среднее значение набора столбцов, начиная с "country_".

expr=[F.sum(train_data_df[x])/colCount for x in train_data_df.columns if 'country_' in x]
avg_train_data_df = train_data_df.withColumn('avg', *expr)

Я получаю следующий ответ об ошибке:

TypeError: withColumn() takes 3 positional arguments but 212 were given

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...