Я работаю с некоторыми данными о игроках НФЛ. Я объединяю два набора данных. В одном наборе данных, называемом ADP, есть имена игроков. Другой, stats, имеет имена игроков и уникальный идентификатор «id» для каждого игрока.
Я объединил два набора данных по имени игрока, но теперь просто хочу убедиться, что ничего не испортилось, если у любого игрока было одинаковое имя. Например, я знаю, что есть два игрока по имени Алекс Смит;Я проверил их данные, и они облажались. Я хочу увидеть список всех этих потенциальных проблем.
Моя идея проверить состоит в том, чтобы концептуально, чтобы R отображал список всех наблюдений в «статистике», где есть дубликат игрока и этот дубликат имеет другой «идентификатор».
Однако я не знаю, как это кодировать. Может кто-нибудь помочь мне здесь? Спасибо!