Я довольно плохо знаком с R и работаю над организацией и очисткой моих данных для подготовки к анализу. Я пытаюсь объединить данные повторных измерений (dataCAL) с одноразовыми начальными данными обследования (dataI) по идентификатору, не дублируя данные обследования.
Я использовал следующее: dataCAL c <- dplyr :: left_join (dataCAL, dataI, by = "ID") </p>
Это объединяет мои данные; однако первоначальные данные опроса для каждого идентификатора копируются в несколько строк, если в dataCAL имеется более одного измерения для этого идентификатора. Это полезно для некоторых анализов, но проблематично c для моей описательной статистики. Я экспериментировал с фильтром и отличался в dplyr, но пока не нашел решения.