выберите строки, где столбец> процентиль (столбец, 0,5) в улье - PullRequest
0 голосов
/ 10 апреля 2020

Я хочу выбрать строки, в которых значение определенного столбца, скажем, A, превышает его значение p50 для целых данных. Поэтому я пишу SQL в улье следующим образом:

set hive.mapred.mode=nonstrict;
with temp_table as (
    select percentile(A, 0.5) as p50
    from my_table
)
select 
    my_table.A
    from my_table, temp_table
    where my_table.A > temp_table.p50

Но процесс зависает. SQL правильно? Или есть лучший способ сделать эту задачу?

...