Может быть pandas .DataFrame.rolling - не лучший способ сделать это, пожалуйста, скажите мне, если есть лучший подход.
Я хочу иметь прокручивающееся окно на df и иметь все столбцы из df доступно в окне для выполнения различных расчетов.
Я полагаю, что приведенный ниже код очень близок к моим целям, но мне трудно понять проблему индекса, как указано в коде.
Сначала x.index = RangeIndex (start = 0, stop = 2, step = 1), а tmp_df правильно выбирает первую и вторую строки в df (индексы 0 и 1). Для последнего x.index = RangeIndex (start = 4, stop = 6, step = 1) кажется, что ilo c пытается выбрать индекс 6 в df, который находится за пределами диапазона (df имеет индекс от 0 до 5).
Чего мне не хватает?
Заранее благодарю за любой совет.
import numpy as np
import pandas as pd
df = pd.DataFrame({'open': [7, 5, 10, 11,6,12],
'close': [6, 6, 11, 10,7,10],
'positive': [0, 1, 1, 0,1,0]},
)
def do_calculations_on_any_df_column_in_window(x,df):
print("index:",x.index)
tmp_df = df.iloc[x.index] # raises "ValueError: cannot set using a slice indexer with a different length than the value" when x.index = RangeIndex(start=4, stop=6, step=1) as df index goes from 0 to 5 only
# do calulations on any column in tmp_df, get result
result = 1 #dummyresult
return result
intervals = range(2, 10)
for i in intervals:
df['result_' + str(i)] = np.nan
res = df.rolling(i).apply(do_calculations_on_any_df_column_in_window, args=(df,), raw=False)
df['result_' + str(i)][1:] = res
print(df)