Я пытаюсь ввести некоторые данные в свой набор данных, основанные на другом.Однако для этого мне нужно сравнить несколько переменных, и у каждой есть вес.Кроме того, мне нужно сформировать пары, используя переменные KEY, которые являются идентификатором в моих данных.
Я пытался использовать compare.linkage
, но не смог найти способ вставить нужные мне веса, например, от 40% до Age
, от 40% до CHBORN
и от 20% до URBAN
.
Complete <- data.frame(KEY = c(001, 002, 003), AGE = c(35, 38, 45), CHBORN = c(2, 3, 4), URBAN = c(1, 2, 2))
incomplete <- data.frame(KEY = c(004, 005, 006), AGE = c(25, 38, 45), CHBORN = c(1, 2, 4), URBAN = c(2, 1, 1))
KEY_Pairs <- compare.linkage(incomplete, complete, blockfld = c(2, 3, 4), strcmp = TRUE, strcmpfun = levenshteinSim()) #I stopped here
Я хочу найти результат, подобный следующему:
KEY_incomplete KEY_complete Scores
004 001 0.95
Обычно я делаю это с помощью программного обеспечения FRIL из Университета Эмори, но я пытаюсьсконцентрируйте все в R
.
Best,
Tereza