Я делаю несколько объединений с одним и тем же фреймом данных. Фреймы данных, с которыми я соединяюсь, являются результатом группировки по моему исходному фрейму данных.
listOfCols = ["a","b","c",....]
for c in listOfCols:
means=df.groupby(col(c)).agg(mean(target).alias(f"{c}_mean_encoding"))
df=df.join(means,c,how="left")
этот код создает более 100000 задач и занимает вечно до фини sh. я вижу в даге много тасовок. как я могу оптимизировать этот код?