Вычисление разности строк, сгруппированных по другой строке в r - PullRequest
0 голосов
/ 25 апреля 2018

У меня есть date, package_id и location_id в трех столбцах.

Предположим, что происходят следующие наблюдения:

packake_id location_id date_id
PACK001    100         2018-04-02
PACK001    101         2018-04-06
PACK002    102         2018-04-12
PACK002    103         2018-04-15
PACK002    101         2018-04-20

Это означает, что PACK001 прибыл в пункт 100 2018-04-02 и прибыл в пункт 101 2018-04-06. Аналогично, PACK002 прибыл в пункт 102 2018-04-12, затем в пункт 103 2018-04-15, затем в пункт 101 2018-04-20.

Я хотел бы добавить столбец days, в котором указано, сколько дней прошло на один пакет в местоположении. В примере это должно быть так:

packake_id location_id days
PACK001       100       4
PACK002       102       3
PACK002       103       5

Спасибо за вашу помощь. Я нашел способы вычисления различий, но они отличаются, потому что это не линейный расчет, потому что они несколько сгруппированы по идентификатору пакета, поэтому последовательное вычитание date_ids неверно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...