Если строки действительно дублированы (как, например, все значения одинаковы), и при условии, что у вас есть переменная идентификатора, которая группирует эти дублированные строки, то вы можете просто взять первую строку для каждого идентификатора.
Примерно так может работать:
library(dplyr)
new_data <- duplicated_data %>%
group_by(ID) %>%
slice(1) %>%
ungroup()
Где duplicated_data
- ваш исходный набор данных, а ID
- переменная идентификатора, которую вы используете, чтобы определить, дублирован ли образец или сейчас.