Разница подсчета в строке данных между двумя кадрами данных в R - PullRequest
0 голосов
/ 29 июня 2018

У меня есть два кадра данных (a1 и a2).

Первый (a1) является исходным набором данных, а второй (a2) такой же, содержит только данные, которые были добавлены к некоторым записям. Я хочу получить количество записей, которые содержат добавленные данные. Мне не нужно просматривать записи.

Как лучше всего просто подсчитать количество записей, которые отличаются в a2?

Ответы [ 2 ]

0 голосов
/ 29 июня 2018

Использование anti_join из dplyr: anti_join a2 с a1 приведет к записям, которые находятся в a2, но не в a1. и подсчитать будет считать строки.

a2 %>% 
  anti_join(a1) %>% 
  tally() 
0 голосов
/ 29 июня 2018

Хорошо, так что сначала позвольте мне разобраться. Вы в основном хотите сравнить два кадра данных и найти количество различных столбцов.

Использование dplyr

> a1
  a b
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e

> a2
  a b
1 1 a
2 2 b
3 3 c

>  df <- setdiff(a1,a2)
  a b
1 4 d
2 5 e

> nrow(df)
2

Это то, что вы ищете?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...