Я хочу выбрать строки, в которых значение определенного столбца, скажем, A, превышает его значение p50 для целых данных. Поэтому я пишу SQL в улье следующим образом:
set hive.mapred.mode=nonstrict;
with temp_table as (
select percentile(A, 0.5) as p50
from my_table
)
select
my_table.A
from my_table, temp_table
where my_table.A > temp_table.p50
Но процесс зависает. SQL правильно? Или есть лучший способ сделать эту задачу?