Question

В этом фрейме данных я нахожу общую зарплату в каждой группе.В Oracle я бы использовал этот код

select job_id,sum(salary) as "Total" from hr.employees group by job_id;

В Spark SQL попробовал то же самое, я столкнулся с двумя проблемами

empData.groupBy($"job_id").sum("salary").alias("Total").show()

Общая сумма псевдонимов не отображается, вместо этого онапоказывая столбец "сумма (зарплата)"
Я не мог использовать $ (я думаю, что синтаксис Scala SQL).Получение компиляции
```
 empData.groupBy($"job_id").sum($"salary").alias("Total").show()
```

Есть идеи?

vdep · Answer 1 · 11 октября 2018

Используйте функцию агрегирования .agg(), если хотите указать псевдоним.Принимается синтаксис scala ($ "")

empData.groupBy($"job_id").agg(sum($"salary") as "Total").show()

Если вы не хотите использовать .agg(), псевдоним также можно указать с помощью .select():

empData.groupBy($"job_id").sum("salary").select($"job_id", $"sum(salary)".alias("Total")).show()

Spark sql group by и сумма изменения имени столбца?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.