Рассмотрим базовый кадр данных как:
data <- data.frame(amount_bin = c("10K-25K", "25K-35K", "35K-45K", "45K-50K", "50K+", "10K-25K", "25K-35K", "35K-45K", "45K-50K", "50K+", "10K-25K", "25K-35K", "35K-45K", "45K-50K", "50K+"),
risk_score = c("0-700", "700-750", "750-800", "800-850", "850-900", "0-700", "700-750", "750-800", "800-850", "850-900", "0-700", "700-750", "750-800", "800-850", "850-900"))
и группирование информации в другом фрейме данных как:
group_info <- data.frame(variable = c("amount_bin_group", "amount_bin_group", "amount_bin_group", "amount_bin_group", "amount_bin_group",
"risk_score_group", "risk_score_group", "risk_score_group", "risk_score_group", "risk_score_group"),
bin = c("10K-25K", "25K-35K", "35K-45K", "45K-50K", "50K+",
"0-700", "700-750", "750-800", "800-850", "850-900"),
group = c("1", "1", "2", "2", "3",
"a", "a", "a", "b", "b"))
Я хочу создать 2 столбца в базовом фрейме данных (data) с именами "amount_bin_group" и "risk_score_group", который принимает значения из столбца group_info $ group, когда столбцы bin из group_info и data совпадают. Для простоты давайте предположим, что базовый столбец всегда будет именем переменной group_info $ минус строка «group». Это подразумевает, что, когда мы хотим создать столбец amount_bin_group, базовый столбец всегда будет amount_bin в базовом кадре данных.
Ожидаемый кадр данных результата:
final_data <- data.frame(amount_bin = c("10K-25K", "25K-35K", "35K-45K", "45K-50K", "50K+", "10K-25K", "25K-35K", "35K-45K", "45K-50K", "50K+", "10K-25K", "25K-35K", "35K-45K", "45K-50K", "50K+"),
risk_score = c("0-700", "700-750", "750-800", "800-850", "850-900", "0-700", "700-750", "750-800", "800-850", "850-900", "0-700", "700-750", "750-800", "800-850", "850-900"),
amount_bin_group = c("1", "1", "2", "2", "3", "1", "1", "2", "2", "3", "1", "1", "2", "2", "3"),
risk_score_group = c("a", "a", "a", "b", "b", "a", "a", "a", "b", "b", "a", "a", "a", "b", "b"))
Решение, которое я только что подумал, заключается в итеративном объединении фреймов данных, т. Е.
final_data <- merge(data, group_info[, c("bin", "group")], by.x = "amount_bin", by.y = "bin")
final_data$amount_bin_group <- final_data$group
final_data$group <- NULL
Но я уверен, что может быть более эффективное решение. Обратите внимание, что таких столбцов несколько, а не только два. Так что, может быть, петля поможет.