Я пытаюсь объединить два набора данных, используя два отдельных имени столбца, но которые имеют одинаковые уникальные значения. Например, столбец A в наборе данных 1 == xyzw, а в наборе данных 2 имя столбца - B, но значение == xyzw.
Однако проблема в том, что в наборе данных 2 значение B столбца == xyzw относится к названиям фирм и появляется несколько раз, в зависимости от того, сколько сотрудников в этой фирме существует в наборе данных.
По сути, я хочу создать новый столбец, назовем его C в наборе данных 1, сообщая, сколько сотрудников в каждой фирме.
Я пробовал следующее:
## Counting how many teachers are in each matched school, using the "Matched" column from matching_file_V4, along with the school_name column from the sample11 dataset:
merged_dataset <- left_join(sample11,matched_datasets,by="school_name")
Хотя этот код работает, он на самом деле не дает мне количество сотрудников на фирму.