Я пытаюсь удалить ошибочный дубликат из моего кадра данных, в котором в строках дубликатов (например, идентификаторы пациентов 1 и 3 ниже) нет информации (NA).
Дубликаты, которые необходимо удалить, всегда встречаются первыми в паре, поэтому я подумал о том, чтобы как-то использовать эту информацию для их удаления.
Упростили приведенные ниже данные, чтобы немного уменьшить проблему (ПРИМЕЧАНИЕ: я ищу функцию, которая может удалить несколько дубликатов, подобных этой, в большом наборе данных без необходимости идентифицировать их вручную):
![Click here for mock dataset](https://i.stack.imgur.com/VBEcV.png)
До сих пор я пытался отработать приведенный ниже код:
test <- ea2[!duplicated(ea2[,c("PatientID", "SessionDate2")]),]
но это, конечно, просто удаляет вторую дублирующую строку для идентификаторов пациентов 1 и 3, которые мне нужно сохранить в наборе данных.