У меня есть таблица с полем Дата, и я хотел бы определить дни, когда данные не дублируются. Давайте представим, что данные выглядят следующим образом:
Day Code Value
01/03/2020 A 10
01/03/2020 B 15
01/03/2020 C 20
02/03/2020 A 10
02/03/2020 B 15
02/03/2020 C 20
03/03/2020 A 10
03/03/2020 B 20
03/03/2020 C 20
04/03/2020 A 10
04/03/2020 B 15
Я хотел бы сгруппировать данные по дням. В этом примере день 02/03/2020 такой же, как 01/03/2020. Однако в 03.03.2020 значение B изменилось. Кроме того, в день 04/03/2020 код C исчез.
Первый подход, который я вижу, состоит в том, чтобы l oop через данные, фильтрующие набор данных по дню (a), и сравнить результат с часть предыдущего дня (b), проверяя, является ли a.equals(b)
TRUE
. Я знаю, что это работает, но это совсем не эффективно, поскольку подразумевает много нарезки.
Есть ли какая-либо операция group_by
, которая могла бы выполнить задачу?
Большое спасибо.