Я новичок в R и пытаюсь выяснить, как назначить уникальные числовые значения двум столбцам идентификаторов строк, V1 & V2 . До сих пор я создавал числовые идентификаторы для каждого уникального идентификатора строки в V1 и применял эти числовые значения к любым совпадающим идентификаторам строки в V2 .
V1 <- c("aaa","bbb","ccc","ddd","eee","fff","ggg","hhh","iii","jjj")
V2 <- c("kkk","lll","aaa","bbb","mmm","nnn","ccc","ddd","ooo","ppp")
factor(V1)
factor(V2)
temp <- data.frame(V1,V2)
for (k in 1:)
temp$id1 <- match(temp$V1, unique(temp$V1))
temp$id2 <- match(temp$V2, unique(temp$V1,temp$V2))
Выход:
V1 V2 id1 id2
[1] aaa kkk 1 NA
[2] bbb lll 2 NA
[3] ccc aaa 3 1
[4] ddd bbb 4 2
[5] eee mmm 5 NA
[6] fff nnn 6 NA
[7] ggg ccc 7 3
[8] hhh ddd 8 4
[9] iii ooo 9 NA
[10] jjj ppp 10 NA
Сейчас я пытаюсь заменить значения NA в id2 уникальными числовыми значениями, как показано ниже, но у меня возникают проблемы с вычислением этого:
V1 V2 id1 id2
[1] aaa kkk 1 11
[2] bbb lll 2 12
[3] ccc aaa 3 1
[4] ddd bbb 4 2
[5] eee mmm 5 13
[6] fff nnn 6 14
[7] ggg ccc 7 3
[8] hhh ddd 8 4
[9] iii ooo 9 15
[10] jjj ppp 10 16
Любая помощь / совет с благодарностью.