Получить учетные записи, которые показывают похожее поведение с набором учетных записей из другого набора данных - PullRequest
0 голосов
/ 19 апреля 2019

У меня есть набор счетов с 2009 года с моей целевой переменной Вероятность дефолта и набор переменных. У меня есть другой набор данных за 2015 год с той же целевой переменной и тем же набором переменных. Теперь я хочу, чтобы для всех учетных записей в данных за 2009 г. я хотел получить однозначное сопоставление с данными за 2015 г. в зависимости от поведения. пример Данные за 2009 год: данные за 2015 год:

Account_id V1 V2 target_var

1 0,1 1 0,5
2 0,7 2 0,2 ​​
3 0,3 3 0,1
4 0,2 4 0,3

Account_id V1 V2 target_var

11 0,2 5 0,7

12 0,7 2 0,4

13 0,6 3 0,8

14 0,3 3 0,6

15 0,4 1 0,3

16 0,1 3 0,9

Я хочу вывод что-то вроде этого

Account_id target_var_2009 target_var_2015
1 0,5 0,7
2 0,2 ​​0,4
3 0,1 0,8
4 0,3 0,6

Не считайте числа. Я только что создал случайный набор данных. Мне нужны учетные записи с одинаковым статистическим поведением среди учетных записей 11,12,13,14,15,16 для 1,2,3,4

...