У меня есть столбец в моих данных, который выглядит так:
# A tibble: 10 x 1
ID_col
<chr>
1 "1020\nNA\nNA\n1020\nNA\nNA\nNA\nNA\nNA\n1020\n1020\n1020\n1020"
2 "1651\nNA\nNA\nNA\n1651\nNA\nNA\nNA\n1651\nNA\n1651\nNA\nNA"
3 "1598\nNA\nNA\nNA\n1598\nNA\nNA\nNA\n1598\nNA\n1598\nNA\nNA"
4 "1141\nNA\nNA\n1141\nNA\nNA\nNA\nNA\nNA\n1141\n1141\n1141\n1141"
Я хочу удалить все значения NA
и все повторяющиеся значения. (Сохраните только одно появление дублированного значения)
Ожидаемый результат для 4 выше будет:
# A tibble: 10 x 1
ID_col
<chr>
1 "1020"
2 "1651"
3 "1598"
4 "1141"
Данные:
structure(list(ID_col = c("1020\nNA\nNA\n1020\nNA\nNA\nNA\nNA\nNA\n1020\n1020\n1020\n1020",
"1651\nNA\nNA\nNA\n1651\nNA\nNA\nNA\n1651\nNA\n1651\nNA\nNA",
"1598\nNA\nNA\nNA\n1598\nNA\nNA\nNA\n1598\nNA\n1598\nNA\nNA",
"1141\nNA\nNA\n1141\nNA\nNA\nNA\nNA\nNA\n1141\n1141\n1141\n1141",
"NA\n835\n835\n835\nNA\nNA\nNA\nNA\n835\n835\nNA\n835\n835",
"1553\nNA\nNA\n1553\nNA\nNA\nNA\nNA\nNA\n1553\n1553\nNA\nNA",
"1542\nNA\nNA\nNA\nNA\nNA\nNA\nNA\nNA\nNA\n1542\nNA\nNA", "NA\nNA\nNA\n1157\nNA\nNA\nNA\nNA\nNA\n1157\nNA\n1157\n1157",
"NA\nNA\nNA\nNA\nNA\nNA\nNA\nNA\n1498\nNA\nNA\nNA\nNA", "NA\n958\n958\nNA\nNA\n958\nNA\nNA\nNA\nNA\nNA\nNA\nNA"
)), row.names = c(NA, -10L), class = c("tbl_df", "tbl", "data.frame"
))