У меня есть 2 воспроизводимых кадра данных здесь. Я пытаюсь определить, какой столбец содержит значения, похожие на другой столбец. Я надеюсь, что мой код будет случайным образом выбирать 1 значение из каждого столбца и проходить через каждый столбец в df2.
df1 <- data.frame(fruit=c("Apple", "Orange", "Pear"), location = c("Japan", "China", "Nigeria"), price = c(32,53,12))
df2 <- data.frame(grocery = c("Durian", "Apple", "Watermelon"), place=c("Korea", "Japan", "Malaysia"), invoice = c("XD1", "XD2", "XD3"))
df1$source <- "DF1"
df2$source <- "DF2"
df1
fruit location price source
1 Apple Japan 32 DF1
2 Orange China 53 DF1
3 Pear Nigeria 12 DF1
df2
grocery place invoice source
1 Durian Korea XD1 DF2
2 Apple Japan XD2 DF2
3 Watermelon Malaysia XD3 DF2
Это вывод, который я надеюсь получить в новом фрейме данных с именем df3.
df3
grocery place invoice source
1 fruit location NA DF1
Исходный столбец позволит пользователю определить, откуда берутся соответствующие столбцы (фрукты / место). Имя столбца df3 = имена столбцов из df2, тогда как значения в строке1 = имена столбцов из df1.
Столбец "Бакалея" сопоставляется с фруктами, поскольку существует совпадающее значение, т. Е. "Яблоко" и "Япония" можно найти в столбцах места и местоположения соответственно.
Спасибо!