У меня есть date
, package_id
и location_id
в трех столбцах.
Предположим, что происходят следующие наблюдения:
packake_id location_id date_id
PACK001 100 2018-04-02
PACK001 101 2018-04-06
PACK002 102 2018-04-12
PACK002 103 2018-04-15
PACK002 101 2018-04-20
Это означает, что PACK001 прибыл в пункт 100 2018-04-02 и прибыл в пункт 101 2018-04-06.
Аналогично, PACK002 прибыл в пункт 102 2018-04-12, затем в пункт 103 2018-04-15, затем в пункт 101 2018-04-20.
Я хотел бы добавить столбец days
, в котором указано, сколько дней прошло на один пакет в местоположении. В примере это должно быть так:
packake_id location_id days
PACK001 100 4
PACK002 102 3
PACK002 103 5
Спасибо за вашу помощь. Я нашел способы вычисления различий, но они отличаются, потому что это не линейный расчет, потому что они несколько сгруппированы по идентификатору пакета, поэтому последовательное вычитание date_ids неверно.