Возможно расширение до: Дегагрегирование / обратное суммирование / расширение набора данных в R У меня есть кадр данных, который выглядит следующим образом:
I_Code Date_1 Date_2
2 14/09/2019 16/08/2019
2 14/09/2019 17/08/2019
2 14/09/2019 19/08/2019
2 14/09/2019 20/08/2019
2 14/09/2019 21/08/2019
2 14/09/2019 21/08/2019
2 14/09/2019 21/08/2019
2 14/09/2019 22/08/2019
2 14/09/2019 23/08/2019
2 14/09/2019 23/08/2019
2 14/09/2019 24/08/2019
2 14/09/2019 27/08/2019
2 14/09/2019 28/08/2019
2 14/09/2019 28/08/2019
2 14/09/2019 29/08/2019
2 14/09/2019 04/09/2019
2 14/09/2019 04/09/2019
2 14/09/2019 04/09/2019
2 14/09/2019 05/09/2019
2 14/09/2019 08/09/2019
2 14/09/2019 10/09/2019
2 14/09/2019 10/09/2019
2 14/09/2019 12/09/2019
I_code может принимать 5 значений.
У меня есть еще один кадр данных, который выглядит следующим образом:
date_2 count
20/09/2019 415
19/09/2019 431
31/08/2019 386
24/09/2019 404
11/08/2019 252
27/09/2019 441
28/09/2019 398
17/09/2019 430
07/09/2019 388
10/09/2019 369
22/08/2019 318
25/09/2019 420
25/08/2019 380
17/08/2019 291
01/09/2019 381
30/08/2019 345
22/09/2019 455
07/09/2019 388
09/08/2019 213
24/09/2019 404
23/08/2019 344
17/08/2019 291
07/09/2019 388
здесь счетчик представляет частоту date_2.
Я хочу расширить фрейм данных до 20 тыс. Записей на основе частоты даты_2 из фрейма данных2.
для каждой даты_2 в кадре данных 1 у нас есть 5 I_code, связанных. Я хочу равномерно распределить их в рамках данных.
например:
20/09/2019 имеет всего 415 отсчетов, тогда нам нужно иметь 415 записей (I_code, Date_1, Date_2). Может быть несколько записей кортежей для 3 полей в кадре данных1. нам нужно выбрать все значения, связанные с date_2, а затем развернуть все записи на основе частоты date_2 в dataframe2.
Может кто-нибудь помочь.