Я хочу использовать формулу для прогнозирования отклонений.Я импортировал файл CSV в Python с двумя столбцами: DATE и RETURN.Теперь я хочу спрогнозировать дисперсию с последними 126 возвращаемыми значениями.Поэтому я хочу добавить новый столбец к моим данным, начиная со строки 126, где последние 126 значений для возврата суммируются, а строка 127 затем суммируются с возвращаемыми значениями от строки 2 до 127 и так далее.Точно так же, как в Excel, когда я опускаю свой код для следующих строк, и мои строки теперь зафиксированы, поэтому диапазон перемещается вниз.
Всего мои данные имеют 24250 значений, и я хочу добавить новую строку с именем SUM126
CODE:
#import file and skip first 14 rows because they are header
DATA = pd.read_csv('DATA.CSV',skiprows=14)
#Named the headers
header_names=['DATE','RETURN WML']
DATA = pd.read_csv('Thesis_DATA.CSV',skiprows=14,names = header_names)
#get the decimal in new column
DATA['(RETURN/100)'] = (DATA['RETURN WML']/100)
и теперь я хочу добавить новый столбецПоэтому я попробовал что-то подобное:
#starting the new column in row 126,running over 1 steps till 24250
for i=(126:1:24250)
#I always want the sum of the last 126 values
relevant_data= data(i-125:i);
#I am creating a new column
DATA['VARIANCE FORECAST']=(sum(relevant_data))
Я рад любой помощи!