У меня есть фрейм данных, который включает данные об импорте и экспорте страны / года в другие страны. Как и в примере набора данных, данные по двоичному импорту и экспорту не полностью совпадают.
например.
library(tidyverse)
df <- data.frame("Reporter" = c("USA", "USA", "USA", "USA", "USA", "USA", "USA", "USA", "Africa","Africa", "Africa","Africa", "Africa","Africa", "Africa","Africa", "EU", "EU","EU", "EU", "EU", "EU","EU", "EU"),
"Partner" = c("Africa","Africa", "Africa","Africa","EU", "EU","EU", "EU", "USA", "USA", "USA", "USA", "EU", "EU","EU", "EU","USA", "USA", "USA", "USA","Africa","Africa", "Africa","Africa"),
"Year" = c(1970, 1970, 1980, 1980, 1970, 1970, 1980, 1980, 1970, 1970, 1980, 1980, 1970, 1970, 1980, 1980, 1970, 1970, 1980, 1980, 1970, 1970, 1980, 1980),
"Flow" = c("Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export","Import", "Export"),
"Val" = runif(24, min=0, max=100), stringsAsFactors = FALSE)
и я создаю широкую версию этих данных.
wide_df <- df %>% spread ("Flow", "Val")
Я могу создавать идентификаторы направлений для диад.
wide_df$ReporterID <- as.numeric(factor(wide_df$Reporter, levels=unique(wide_df$Reporter)))
Однако полученные данные считают разными, например, диады США и Африки, а также Африки и США.
Вопрос: Как создать уникальный идентификатор для каждого диада?
Может кто-нибудь придумать способ, позволяющий мне свести эти диады в один идентификационный код
Спасибо за внимание!