в следующем файле data.df мы видим, что строки 2 и 3 идентичны и отличается только среднее значение строки 4.
iso3 dest code year uv mean
1 ALB AUT 490700 2002 14027.2433 427387.640
2 ALB BGR 490700 2002 1215.5613 11886.494
3 ALB BGR 490700 2002 1215.5613 11886.494
4 ALB BGR 490700 2002 1215.5613 58069.405
5 ALB BGR 843050 2002 677.9827 4272.176
6 ALB BGR 851030 2002 31004.0946 32364.379
7 ALB HRV 392329 2002 1410.0072 6970.930
Есть ли простой способ автоматически найти эти строки?
Я нашел эту тему , которая, кажется, отвечает на этот вопрос, но я не понимаю, как 'duplicated () `работает ...
Мне нужна «простая» команда, в которой я мог бы указать, какое значение столбца по строке должно быть одинаковым.
что-то вроде: function(data.df, c(iso3, dest, code, year, uv, mean))
чтобы найти те же самые строки и function(data.df, c(iso3, dest, code, year, uv))
чтобы найти "квази" те же строки ...
ожидаемый результат будет примерно таким, в первом случае:
2 ALB BGR 490700 2002 1215.5613 11886.494
3 ALB BGR 490700 2002 1215.5613 11886.494
и во втором:
2 ALB BGR 490700 2002 1215.5613 11886.494
3 ALB BGR 490700 2002 1215.5613 11886.494
4 ALB BGR 490700 2002 1215.5613 58069.405
есть идеи?