Я импортировал файл json, и теперь у меня есть фрейм данных, в котором один столбец (код) является списком.
index year gvkey code
0 1998 15686 ['TAX', 'ENVR', 'HEALTH']
1 2005 15372 ['EDUC', 'TAX', 'HEALTH', 'JUST']
2 2001 27486 ['LAB', 'TAX', 'HEALTH']
3 2008 84967 ['HEALTH','LAB', 'JUST']
То, что я хочу получить, выглядит следующим образом:
index year gvkey TAX ENVR HEALTH EDUC JUST LAB
0 1998 15686 1 1 1 0 0 0
1 2005 15372 1 0 1 0 1 0
2 2001 27486 1 0 1 0 1 0
3 2008 84967 0 0 1 0 1 1
После Pandas преобразовать столбец списка в макеты Я попробовал следующий код (где df - мой фрейм данных):
s = pd.Series(df["code"])
l = pd.get_dummies(s.apply(pd.Series).stack()).sum(level=0)
Я получаю вторая часть права данных (переменные TAX, ENVR, HEALTH, EDU C, JUST и LAB), но потеря первой (year и gvkey).
Как сохранить переменную year и gvkey?