У меня есть df, похожий на df1, где я хочу разбить строки так, чтобы столбец HOURS находился в интервалах 4, как показано в df2.Как бы я подошел к этой проблеме и какие пакеты рекомендуются?
идентификаторы могут иметь более одной последовательности в данный день.Например, идентификатор может быть указан 2-3 раза в течение определенного дня, при этом ему назначается более одной единицы и более одного кода.
Требуется следующее:
- Все категориальные данные должны оставаться одинаковыми в дочерних строках (например, CODE остается одинаковым в каждой дочерней строке)
- Если естьесли остаток меньше четырех, сумма остатка должна быть указана в последней строке (например, df2; строка B)
- Если дочерняя строка начинается или заканчивается на следующую дату, столбец даты должен быть обновленсоответственно (например, df2; строка E)
df1 (текущий)
EMPLID TIME_RPTG_CD START_DATE_TIME END_DATE_TIME Hrs_Time_Worked
<chr> <chr> <dttm> <dttm> <dbl>
1 X00007 REG 2014-07-03 16:00:00 2014-07-03 02:00:00 10.0
df2 (желательно)
EMPLID TIME_RPTG_CD START_DATE_TIME END_DATE_TIME Hrs_Time_Worked
<chr> <chr> <dttm> <dttm> <dbl>
1 X00007 REG 2014-07-03 16:00:00 2014-07-03 20:00:00 4.0
1 X00007 REG 2014-07-03 20:00:00 2014-07-04 24:00:00 4.0
1 X00007 REG 2014-07-04 24:00:00 2014-07-04 02:00:00 2.0