groupBy игнорирует пустые столбцы. Чтобы включить эти столбцы, необходимо присвоить значения этим пустым ячейкам. Это можно сделать с помощью df.na.fill
. Используя это, вы можете назначить значение по умолчанию для этих столбцов (0, если вы хотите включить их в среднее значение или сумму; «some_sample_string», если это столбец типа строки и т. Д.). После заполнения, вы можете применить операцию groupBy для получения желаемого результата.
См. Код ниже:
val new_df = df.na.fill(0, Seq("column_list"))
.na.fill("sample_string", Seq("string_column_list"))
Теперь вы можете использовать new_df для выполнения ваших расчетов. Надеюсь, это поможет.