Для анализа панели данных в Python я хотел бы проверить вероятности перехода. У меня есть комбинации человеко-год и некоторые категориальные переменные, например, здоровье (1=excellent
, 2=good
и т. Д.).
Мне нужна сводная таблица абсолютных и / или относительных частот о том, как часто происходят изменения от одного состояния / категории к другому - на человека, а не на столбец. Особенно не следует учитывать разницу в состоянии здоровья между индексами 6
и 7
, поскольку это не переход от одного человека.
Вот некоторые примеры данных:
import pandas as pd
df = pd.DataFrame({'year': ['2003', '2004', '2005', '2006', '2007', '2008', '2009',
'2003', '2004', '2005', '2006', '2007', '2008', '2009'],
'id': ['1', '1', '1', '1', '1', '1', '1',
'2', '2', '2', '2', '2', '2', '2',],
'health': ['3', '1', '2', '2', '5', '1', '1',
'1', '2', '3', '2', '1', '1', '2']}).astype(int)
Вывод должен быть следующим (с учетом случаев перехода состояний):
![enter image description here](https://i.stack.imgur.com/yf2Yi.png)
(Возможно, в Python есть что-то похожее на команду xttrans
Stata?)