У меня есть набор данных, содержащий «UI» (уникальный идентификатор), время, частоту (частоту для заданного значения в столбце UI), как показано здесь:

Что бы я хотел добавить в новый столбец с именем daily_frequency, который просто подсчитывает каждое уникальное значение в столбце пользовательского интерфейса для данного дня последовательно, как показано на рисунке ниже.

Например, если UI = 114737, и это повторяется 2 раза в один день, у нас должно быть 1 и 2 в столбце daily_frequency.
Я мог бы сделать это с помощью пакетов Python и Panda, используя методы group by и cumcount следующим образом ...
df['daily_frequency'] = df.groupby(['UI','day']).cumcount()+1
Однако по какой-то причине Я должен сделать это с помощью SQL-запросов (Amazon Redshift) .