Информационная матрица из pandas dataframe - PullRequest
0 голосов
/ 15 февраля 2019

У меня есть фрейм данных pandas, подобный следующему:

    Customer Id  year
0       1510220024  2017
1       1510270013  2017
2       1511160047  2017
3       1512100014  2017
4       1603180006  2017
5       1605030030  2017
6       1605160013  2017
7       1606060008  2017
8       1510220024  2018
9       1606270014  2017
10      1608080011  2017
11      1608090002  2017
12      1511160047  2018
13      1606270014  2018

И я хочу построить следующую матрицу из вышеупомянутого фрейма данных:

     2017 2018
2017  11   3
2018   3   3

Эта матрица говорит, что было всего11 клиентов в 2017 году и три из них также появились в 2018 году и так далее.На самом деле у меня есть данные за 7 лет, так что это будет матрица 7x7.Я борюсь некоторое время сейчас, но не могу понять это правильно.

1 Ответ

0 голосов
/ 15 февраля 2019

merge + crosstab:

m = df.merge(df, left_on='Customer Id', right_on='Customer Id')
pd.crosstab(m.year_x, m.year_y)

year_y  2017  2018
year_x
2017      11     3
2018       3     3
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...