Цикл последовательных строк в R для определения перекрывающихся периодов - PullRequest
0 голосов
/ 30 марта 2020

У меня есть таблица в форме

    id      year_from  year_to
    1234    1990       1996
    1234    1995       2018 
    1234    2001       2005
    1234    2020       2021

I * sh для создания столбца updated_year_to с использованием предыдущей таблицы следующим образом:

    id      year_from  year_to  modified_year_to
    1234    1990       1996     2018
    1234    1995       2018     2018
    1234    2001       2005     2018
    1234    2020       2021     2021

для созданияified_year_to. строки и проверка на разрыв в годах по идентификатору. Между 1990 и 2018 годами нет разрыва (совпадение по годам в первых трех строках). Следовательно, updated_year_to равен 2018 для первых трех строк. После разрыва мы снова ищем максимальное значение year_to в следующем непрерывном периоде и получаем значение 2021 в качестве updated_year_to для четвертой строки.

Спасибо!

данные:

structure(list(id = c(1234, 1234, 1234, 1234), year_from = c(1990, 
1995, 2001, 2020), year_to = c(1996, 2018, 2005, 2021)), row.names = c(NA, 
-4L), class = c("tbl_df", "tbl", "data.frame"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...