Я просто работаю над левым соединением с помощью stringdist_join (), и у меня возникли проблемы, поскольку в моих выходных данных больше строк, чем в моем исходном «левом» фрейме данных.
nrow(records_nona)
#output : 603
nrow(institutions)
# output : 981
records_nona <- stringdist_left_join(records_nona, institutions,
by = c("tm_1_undergradu" = "Institution.Name"))
nrow(records_nona)
# output: 635
Я не уверен, что я мог испортить здесь, чтобы это было возможно. Или мое понимание левых соединений неверно. Любое руководство будет оценено, спасибо.