У меня большой набор данных, 4000 наблюдений и две переменные. Две переменные являются символами, особенно именами. Я хочу удалить все строки, в которых col2 (Фамилия) не совпадает точно с символом ЛЮБОГО col 1 (Имя).
Вот посмотрите, как выглядит набор данных
Я пытался использовать% в%, но он возвращает строки, которые повторяются в 1 столбце, а не в столбцах.
Я видел много советов о том, как сопоставить одну, две или несколько указанных c строк символов с другим столбцом, а затем извлечь. Тем не менее, в этом случае я точно не знаю, какие именно строки c я хочу сопоставить. Я надеюсь найти способ для R найти эти перекрестные столбцы для меня.
Вот пример ввода df:
First Last
Joe Weinberg
Hilton Alexander
Tom Marshall
Fred Hilton
Я бы хотел, чтобы вывод df выглядел так :
First Last
Hilton Alexander
Fred Hilton
Любая помощь будет принята с благодарностью