У меня есть две таблицы в HDFS, к которым я хочу присоединиться, используя Impala.Один - Employee_Logs, другой - HR_Data.
Запросы:
select e.employee_id, e.action from Employee_Logs e where e.employment_status_desc = 'Active'
select h.employee_id, h.name from HR_Data h
Employee_Logs:
employee_id action
2325255b login
51666164 login
51666164v login
r1211 logoff
r18552421 login
HR_Data:
employee_id name
2325255 Rob
51666164 Tom
r1211 Tammy
r18552421 Ron
Я хочусоедините их так, чтобы данные выглядели так:
employee_id action name
2325255b login Rob
51666164 login Tom
51666164v login Tom
r1211 logoff Tammy
r18552421 login Ron
Я мог бы сделать простое объединение, если бы поле employee_id совпало в обеих таблицах, но у одного и того же пользователя могут быть буквы "b" или "v"после идентификатора их сотрудника, чтобы указать, повышена ли учетная запись как учетная запись администратора.В некоторых учетных записях перед идентификатором стоит «r», но в обеих таблицах это так.
Есть ли способ, где я могу выполнить некоторые действия, где можно создать действия и создать новое поле в таблице Employee_Logs, например убрать "v" и "b" с конца идентификатора сотрудника, а затем присоединиться или есть?лучший способ?