У меня есть таблица в форме
id year_from year_to
1234 1990 1996
1234 1995 2018
1234 2001 2005
1234 2020 2021
I * sh для создания столбца updated_year_to с использованием предыдущей таблицы следующим образом:
id year_from year_to modified_year_to
1234 1990 1996 2018
1234 1995 2018 2018
1234 2001 2005 2018
1234 2020 2021 2021
для созданияified_year_to. строки и проверка на разрыв в годах по идентификатору. Между 1990 и 2018 годами нет разрыва (совпадение по годам в первых трех строках). Следовательно, updated_year_to равен 2018 для первых трех строк. После разрыва мы снова ищем максимальное значение year_to в следующем непрерывном периоде и получаем значение 2021 в качестве updated_year_to для четвертой строки.
Спасибо!
данные:
structure(list(id = c(1234, 1234, 1234, 1234), year_from = c(1990,
1995, 2001, 2020), year_to = c(1996, 2018, 2005, 2021)), row.names = c(NA,
-4L), class = c("tbl_df", "tbl", "data.frame"))