Я заинтересован в симуляции данных с вероятностью пропуска. Как я могу сделать это, используя dplyr::na_if
?
Интуитивно я хотел сделать что-то вроде:
mtcars %>%
mutate(mpg = na_if(mpg, rbinom(n = n(),
1,
prob = .5) == 1))
Но я думаю, что это неправильно, потому что na_if
действительно для сопоставления x
и y
. Как я могу использовать na_if
для создания вероятности пропуска?
(редактировать: Также, если есть лучшая функция для создания отсутствующих данных в tidyverse
, пожалуйста, дайте мне знать в комментариях)