Я надеюсь, что смогу достаточно подробно описать свой вопрос.У меня очень большой фрейм данных в R. В этом фрейме данных у меня иногда есть одна строка для одного человека, а иногда у меня есть две строки для одного человека.Теперь я хочу объединить строки, если люди идентичны (имеют одинаковый уровень фактора на фактор человека).Однако все мои переменные, кроме двух, идентичны, если коэффициент уровня одинаков.Две переменные, которые не идентичны, являются факторами и нуждаются в информации из обеих строк, поэтому вторая строка должна быть указана в качестве нового столбца для первой строки.
Я надеюсь, что кто-нибудь может мне помочь, большое спасибо.Прошу прощения, если проблема не ясна. Я с удовольствием отвечу на дополнительные вопросы.
Вот так выглядят мои данные, за исключением того, что кадр данных намного больше:
zz <- "Person Address Happening Date Job
John abc Birth 22/03/1940 IT
John abc Death 22/10/2018 IT
Sarah cde Birth 10/07/1930 Teacher
Sarah cde Death 01/07/2000 Teacher
Susi bfg Birth 01/01/1990 secretary"
Data <- read.table(text=zz, header = TRUE)
Вы можетевидите, что некоторые люди появляются дважды, потому что у них есть дата смерти, те люди, которые еще живы, очевидно, появляются только один раз.В долгосрочной перспективе я хочу вычислить возрастной интервал и построить новый фактор, который говорит, живы ли Люди или нет.
Все, что я мог найти, это коды вроде этого:
mtcars %>%
group_by(cyl) %>%
summarise(disp = mean(disp), sd = sd(disp))
Однако проблема в том, что я не могу на самом деле суммировать переменные, поскольку они либо являются факторами, либо я хочу вычислить разницу между ними.