Я построил информационный фрейм, чтобы сохранить составляющую фондового индекса с течением времени, выполнив следующие шаги:
1) Сначала я загружаю необработанные данные через провайдера данных и сохраняю их в формате
2) Преобразовать в фрейм данных, чтобы получить:
constituent_pd = pd.DataFrame.from_dict(constituent, orient='index')
index col1 col2 col3 etc...
1/1/92 stockA stockB NA etc...
2/1/92 stockB stockC stockD etc...
3) Превратить в логический кадр данных с:
constituent_bol = pd.get_dummies(constituent_pd.stack()).max(level=0).astype(bool)
index stockA stockB stockC etc...
1/1/92 True True False etc...
2/1/92 False True True etc...
Оттуда я пытался найти способ быстро обновить мою таблицу.
Чтобы сделать это, мне нужно было бы снова преобразовать конституционный_бин в исходную словарную форму, объединить его с новым словарём (для более поздних дат) и перезапустить весь процесс.
step1 = constituent_bol.astype('int32')
step2 = step1[step1 ==1].stack().reset_index().drop(0,1).set_index('level_0')
1/1/92 stockA
1/1/92 stockB
etc...
и я не знаю, как изменить этот длинный фрейм данных, например ,entent_pd, чтобы получить ДИК позже.
Спасибо за любую помощь!