Я объединил набор данных 1 (3346 наблюдений) и набор данных 2 (10000 наблюдений) в 2 общих столбца, используя:
new_dataset=inner_join (dataset1,dataset2, by=c("name1","name2"))
, и у меня появился новый набор данных из 4501 наблюдений.Оба набора данных являются ответами на обследования, и к выборке был применен вес dataset1
, поэтому для ее анализа мне необходимо поддерживать размер выборки в 3346 наблюдений.Я не знаю, как выбрать только правильные 3346 наблюдений (те, которые являются общими для обоих наборов данных) из 4501 наблюдений моего нового набора данных.Спасибо за любую помощь, оказанную