UDF Python для улья с использованием pandas dataframe, groupby и сортировки - PullRequest
0 голосов
/ 04 ноября 2018

У меня есть таблица в улье, и я хочу создать python udf для случая ниже

hive table

Я хочу сгруппировать по стране и городу, а затем отсортировать дату в ASC, используя python

Sorted data

Наконец, я хочу присвоить какое-то уникальное значение, основанное на значении datedifference, равном = 1 Я хочу, чтобы результат в этом формате ниже

result

И новый столбец SE_value, который я хочу использовать в моей таблице Hive

...