У меня есть одна таблица улья, в которой у меня есть столбцы (id, dept, salary). Я применяю некоторые преобразования к этой таблице, используя spark SQL.
, т. Е. Если в отделе работает HR, то salary = salary +100, если отдел ИТ, то зарплата = оклад + 0 и основывается на том, что отдел берет сумму зарплат. PFB
Входные данные
+----+-----------+--------+
| id | dept | salary |
+----+-----------+--------+
| 1 | HR | 100 |
| 2 | operation | 200 |
| 3 | tech | 300 |
| 4 | IT | 400 |
| 1 | HR | 500 |
+----+-----------+--------+
Ожидаемый результат
+----+-----------+--------+
| id | dept | salary |
+----+-----------+--------+
| 1 | HR | 800 |
| 2 | operation | 300 |
| 3 | tech | 300 |
| 4 | IT | 400 |
+----+-----------+--------+
Я написал код ниже, но он не работает в искре sql.
spark.sql("select CASE WHEN dept = 'HR' THEN 'sum(salary+100)',when dept = 'IT' THEN 'sum(salary+0)' ELSE 'salary' END AS salary from emp group by dept").show
, но не совпадает ввод: проблема. Пожалуйста, помогите, как я должен реализовать это.