Вот мой входной файл:
inputfile_pd=pd.DataFrame([['2018-02-02',10, 2], ['2018-02-02',1, 3], ['2018-02-02',3, 4], ['2018-02-03',3, 2], ['2018-02-03',2, 3], ['2018-02-03',4, 4], ['2018-02-04',4, 3],['2018-02-04',1, 4]], columns=['DateOfSale','Sales','Client_id'])
, поэтому он выглядит так:
DateOfSale Sales Client_id
0 2018-02-02 10 2
1 2018-02-02 1 3
2 2018-02-02 3 4
3 2018-02-03 3 2
4 2018-02-03 2 3
5 2018-02-03 4 4
6 2018-02-04 4 3
7 2018-02-04 1 4
Какой самый простой способ вычислить матрицу корреляции для продаж клиентам с различными идентификаторами в этомТаблица?
ответ, который я ищу, может выглядеть следующим образом
Client2_sales Client3_sales Client4_sales
Client2_sales some val some val some val
Client3_sales some val some val some val
Client4_sales some val some val some val