Добрый день,
Я sh, чтобы проверить, существует ли моя переменная в любой из двух таблиц, и получить результат в одной таблице для дальнейшей обработки. Я решил, что это просто:
'''
select concent, concent_big from
(select count(*) as concent where core_id = "{}" ) as a
left join
(select count(*) as concent_big ,concent_2 where core_id = "{}" ) as b
on 1 = 1
'''
Однако это, похоже, недопустимо. Это немного сбивает с толку, так как я делал аналогичные вещи в Sql ранее. Теперь pySpark доставляет мне неприятности. Я придумал обходной путь, но это (imho) глупо:
'''
select concent, concent_big from
(select count(*) as concent, 1 as tmp_key from concent where core_id = "{}" ) as a
left join
(select count(*) as concent_big , 1 as tmp_key from concent_2 where core_id = "{}" ) as b
on a.tmp_key = b.tmp_key
'''
Есть идеи, как сделать это более элегантно?