У меня есть набор счетов с 2009 года с моей целевой переменной Вероятность дефолта и набор переменных. У меня есть другой набор данных за 2015 год с той же целевой переменной и тем же набором переменных. Теперь я хочу, чтобы для всех учетных записей в данных за 2009 г. я хотел получить однозначное сопоставление с данными за 2015 г. в зависимости от поведения.
пример
Данные за 2009 год: данные за 2015 год:
Account_id V1 V2 target_var
1 0,1 1 0,5
2 0,7 2 0,2
3 0,3 3 0,1
4 0,2 4 0,3
Account_id V1 V2 target_var
11 0,2 5 0,7
12 0,7 2 0,4
13 0,6 3 0,8
14 0,3 3 0,6
15 0,4 1 0,3
16 0,1 3 0,9
Я хочу вывод что-то вроде этого
Account_id target_var_2009 target_var_2015
1 0,5 0,7
2 0,2 0,4
3 0,1 0,8
4 0,3 0,6
Не считайте числа. Я только что создал случайный набор данных. Мне нужны учетные записи с одинаковым статистическим поведением среди учетных записей 11,12,13,14,15,16 для 1,2,3,4