У меня есть набор данных в следующем виде:
Product | Date
123 | 2019-01-01
456 | 2019-01-01
123 | 2019-01-02
123 | 2019-01-03
456 | 2019-01-03
123 | 2019-01-04
456 | 2019-01-04
789 | 2019-01-04
Это просто упрощенная версия.Полный набор содержит ~ 300 товаров и данные за четыре месяца.Я хочу понять, как набор продуктов менялся с течением времени.Очевидно, что легко подсчитать количество в день и увидеть, что я потерял один продукт 2 января, а другой - 4 января, но потом я не знаю, какой это был продукт.
Есть ли более систематический способсобирается об этом?В идеале выходные данные должны показывать мне список дней и продуктов, которые выпали / были добавлены в тот день, например:
Date | Product | Type
2019-01-02 | 456 | Out
2019-01-03 | 456 | In
2019-01-04 | 789 | In
Я думал о мин. (Дата), макс. (Дата) по продуктам раньше, но продуктыможно удалять и добавлять повторно, и я не буду перехватывать это туда-сюда таким образом.
Доступны следующие среды: Python, SQL и Excel.
Спасибо