Я хотел знать, как можно удалить строки, значения которых в двух разных столбцах не совпадают. Вот пример, иллюстрирующий мою проблему:
test.1 <- c("A", "B", "C", "D")
test.2 <- c("2009-02", "2009-04", "2010-01", "2011-02")
test.3 <- c("2009-02", "2009-08", "2010-01", "2013-06")
test.data <- data.frame(test.1, test.2, test.3)
, который дает:
test.1 test.2 test.3
1 A 2009-02 2009-02
2 B 2009-04 2009-08
3 C 2010-01 2010-01
4 D 2011-02 2013-06
Я хотел бы удалить строки, где test.2 и test.3 не равны, т.е. второй и четвертый ряды. Я попытался с дублированной функцией, поскольку обнаружил, что
test.data.2 = test.data[!duplicated(test.data[,c('test.2', 'test.3')]),]
удалит строки, где test.2 = test.3. Поэтому я удаляю "!" следующим образом:
test.data.2 = test.data[duplicated(test.data[,c('test.2', 'test.3')]),]
но это не работает. Есть ли у вас какие-либо другие предложения? Большое спасибо за вашу помощь