Подсчет строк с уникальным идентификатором в R studio с длиной (уникально) - PullRequest
0 голосов
/ 26 февраля 2020

У меня есть набор данных с идентификаторами людей (некоторые люди (идентификаторы) имеют несколько строк) и рисками (расшифрованы в количестве от 1 до 7, а некоторые NA), и я хотел подсчитать количество людей в каждой группе риска, без учета одного и того же человека дважды. При создании подмножества, содержащего только 1 строку / человека, я получаю определенное количество людей для каждой группы. Однако, когда я использую эту функцию (для каждой группы риска):

length(unique(data$person_id[data$RISK==1])

, мне кажется, что в каждой группе риска я получаю одного дополнительного человека (таким образом, всего 7 дополнительных человек). У кого-нибудь есть объяснение этому? Нужно ли делать -1 каждый раз, когда я использую эту функцию?

Заранее спасибо!

...