Как заполнить пропущенные дни данными со средним числом дней до и после - PullRequest
0 голосов
/ 11 июля 2019

Я получил Данные Amazon Stock от Yahoo финансирует , но есть некоторые пропущенные дни, когда данных нет.

Мне было интересно, есть ли способ, используя google collab , чтобы затем "создать" эти пропущенные дни и заполнить их средним значением всех соседних дней.

Я хочу использовать ближайшие дни с данными, до и после пропущенных дней , для создания данных за пропущенные дни.

Я посмотрел на многие ответы слабины, ноЯ не могу найти конкретный ответ на свое решение.Команда, которая кажется наиболее близкой: ws = Amazon.worksheet('Amazon') idx = pd.date_range(start = '05-15-1997', end = '07-05-2019') Amazon_df = get_as_dataframe(ws) AMZ = pd.DataFrame(Amazon_df) AMZ.index = pd.DatetimeIndex(AMZ.index) AMZ = AMZ.reindex(idx, fill_value=np.nan)

Проблема с этой командой заключается в том, что мне придется вручную добавлять недостающие дни, а при наличии акций Amazon это займет очень много времени.

Не могу понять, как решить эту проблему.Ссылка на электронную таблицу: https://docs.google.com/spreadsheets/d/1fLicjjVRTchd8ps6aiVsGfP1GVFfvJN2rgfoYxxSHZk/edit?usp=sharing

Я хочу выяснить эти данные, чтобы иметь возможность составлять график без случайных «пропущенных» дней.Я хотел бы заполнить «пропущенные» дни средними значениями дней до и после, которые фактически имеют данные.

1 Ответ

0 голосов
/ 11 июля 2019

Я думаю, вы могли бы использовать симуляцию для заполнения пропущенных значений.У меня есть функция rts_clean(), но в коде R (пакет GeoRTS) она основана на декомпозиции лессового уровня (тренд, стационарность и шум, которые допускают пропущенные значения), сначала разбейте временной ряд в этих трех компонентах, затемвы просто моделируете значения шума, используя его распределение (для доступных данных).Тогда вы получите что-то вроде этого:

Пример: https://github.com/InstitutoInvestigacionesEconomicasPUCE/geortsBeta/blob/master/man/figures/rearme_img1.png

Код: https://github.com/InstitutoInvestigacionesEconomicasPUCE/geortsBeta/blob/master/R/rts_clean.R

...