Суммируйте 126 предыдущих значений для прогноза отклонений в новом столбце с фиксированным диапазоном - PullRequest
0 голосов
/ 27 декабря 2018

Я хочу использовать формулу для прогнозирования отклонений.Я импортировал файл CSV в Python с двумя столбцами: DATE и RETURN.Теперь я хочу спрогнозировать дисперсию с последними 126 возвращаемыми значениями.Поэтому я хочу добавить новый столбец к моим данным, начиная со строки 126, где последние 126 значений для возврата суммируются, а строка 127 затем суммируются с возвращаемыми значениями от строки 2 до 127 и так далее.Точно так же, как в Excel, когда я опускаю свой код для следующих строк, и мои строки теперь зафиксированы, поэтому диапазон перемещается вниз.

Всего мои данные имеют 24250 значений, и я хочу добавить новую строку с именем SUM126

CODE:

#import file and skip first 14 rows because they are header
DATA = pd.read_csv('DATA.CSV',skiprows=14)
#Named the headers
header_names=['DATE','RETURN WML']
DATA = pd.read_csv('Thesis_DATA.CSV',skiprows=14,names = header_names)
#get the decimal in new column
DATA['(RETURN/100)'] = (DATA['RETURN WML']/100)

и теперь я хочу добавить новый столбецПоэтому я попробовал что-то подобное:

#starting the new column in row 126,running over 1 steps till 24250
for i=(126:1:24250)
#I always want the sum of the last 126 values
    relevant_data= data(i-125:i);
#I am creating a new column 
    DATA['VARIANCE FORECAST']=(sum(relevant_data))

Я рад любой помощи!

...