В новом столбце я хотел бы указать, что каждый раз, когда объединяются обновления отсутствующей записи.
Цель : у меня есть набор данных с пропущенными категориальными кодами. Чтобы заменить пропущенные значения, я использую несколько операций left_join/coalesce
, которые заменяют NA правильными кодами. Я хотел бы отслеживать, какие значения менялись во время каждой итерации.
# DATA
df <- tibble(
x = c(1, 2, 3, NA, NA), #<Original data
y = c( 1, NA, 3, 4, NA) #<New data from join
)
# A tibble: 5 x 2
x y
<dbl> <dbl>
1 1 1
2 2 NA
3 3 3
4 NA 4
5 NA NA
Хотелось бы увидеть ...
# A tibble: 5 x 2
x changed
<dbl> <chr>
1 1 no.change
2 2 no.change
3 3 no.change
4 4 corrected
5 NA no.change