Для данных, указанных ниже, я хочу новый столбец в данных, который должен иметь постоянное значение суммы столбца частоты.
+------+----+
|number|freq|
+------+----+
| 8| 1|
| 6| 2|
| 2| 4|
+------+----+
Результат должен выглядеть как
+------+----+-------+
|number|freq|new_col|
+------+----+-------+
| 8| 1| 7|
| 6| 2| 7|
| 2| 4| 7|
+------+----+-------+
, и я хочу это без groupBy
или agg
. Я пытался:
var x = sum(df("freq"))
df.withColumn("new_col",lit(x))
или
df.withColumn("new_col",x)
или
df.withColumn("new_col",sum($"freq"))
Но ни один не помог.