У меня есть два вектора почтовых индексов (сайты и клиенты). Я пытаюсь найти комбинацию пар между двумя векторами.
Следовательно, если размер сайта 3, а клиента размер 4 ... я бы ожидал 12 комбинаций. В настоящее время я использую Crossing (), чтобы сделать это в R.
Однако, когда я добавляю свои действительные сайты данных размером 20 и размером клиентов 6057, функция возвращает 35 760 комбинаций, когда я ожидал 121 140 (6057 * 20). ) комбинации. Означает ли это, что было так много дублированных комбинаций, и они были удалены?
Мой код скопирован ниже. Заранее спасибо.
data <- read_xlsx("Sites.xlsx", sheet = "Sheet3")
data2 <- read_xlsx("Customers.xlsx", sheet = "Sheet1")
sites <- as.vector(data['FRT - Ship From Zip'])
sites
Customers <- as.vector(data2['Ship_To_Zip'])
Customers
Comdata <- crossing(Customers,sites)
Customers <- as.vector(Comdata['Ship_To_Zip'])
sites <- as.vector(Comdata['FRT - Ship From Zip'])