Я довольно новичок в R, и я пытаюсь решить эту проблему, которая кажется довольно простой, но я не знаю, как с этим справиться. Я пытаюсь сравнить два фрейма данных и распечатать строки, которые находятся в одном, но не в другом, а также распечатать другой список / фрейм данных со строками, в которых была обновлена только одна ячейка.
df1
firstname lastname email
Grace Holly hollyoaks@yahoo.com
Trish Edison edisontrish@gmail.com
df2
firstname lastname email
Grace Holly rickyoaks@yahoo.com
Frederick Sam sammic@gmail.com
Первое, что я хотел сделать, это получить строки, которые были в df2, а не в df1, и вот как я это сделал:
require(sqldf)
df2NotIndf1 <- sqldf('SELECT * FROM df2 EXCEPT SELECT * FROM df1')
Это дало мне вывод:
`firstname lastname email`
`Frederick Sam sammic@gmail.com`
Теперь мне нужен способ получить первую строку как свой собственный вывод, отметив, что имя и фамилия совпадают, но адрес электронной почты отличается.
Итак, я хочу способ распечатать:
firstname lastname email
Grace Holly rickyoaks@yahoo.com
Я посмотрел на функцию сравнения (), а также функции слияния и другие функции, но, похоже, они сравниваются, чтобы обнаружить разные строки вместо разных ячеек.