Я хотел бы спросить, как я могу улучшить свой скрипт в сопоставлении двух одинаковых строковых значений из 2 разных таблиц с помощью hive ql.
Script:
select
img,
case when a.img = b.img then "True" else "False" end as sftp_srvr,
case when b.img = a.img then "True" else "False" end as ETL_srver
from tbl1 a inner join tbl2 b
on a.img = b.img
Требования:
У меня есть две таблицы, одна - это список всех файлов, доступных на сервере sftp, тогда у меня есть вторая таблица, которая является списком файлы на нашем сервере etl. (ожидается, что все файлы с sftp-сервера сбрасываются на etl-сервер)
Мне нужно проверить, где данные (столбец img) присутствуют в sftp srvr (tbl1), тогда я вернусь истина и ложь, если нет, тогда, если данные доступны в etl_srvr (2-я таблица), тогда будет возвращено истина, иначе ложь.
img | sftp_srvr | etl_srvr | img_fn_1 | ИСТИНА | ЛОЖЬ | img_fn_2 | ИСТИНА | ИСТИНА |