У меня есть пример кадра данных для панд:
a b
0 6.0 0.6
1 1.0 0.3
2 3.0 0.8
3 5.0 0.1
4 7.0 0.4
5 2.0 0.2
6 0.0 0.9
7 4.0 0.7
8 8.0 0.0
9 9.0 0.5
Я хочу добавить новый столбец linear
к столбцу, который является выходом линейной регрессии для подгонки a на b. Теперь я получил:
from sklearn.linear_model import LinearRegression
repr = LinearRegression()
repr.fit(df['a'].as_matrix().reshape(-1,1),df['b'].as_matrix().reshape(-1,1))
repr.predict(df['a'].as_matrix().reshape(-1,1)) # This will give the linear regression outcome for whole column
Теперь я хочу постепенно выполнять линейную регрессию на сериях a
, поэтому первая запись linear
будет b[0]
, а вторая будет b[0]/a[0]*a[1]
, а третья будет результатом линейной регрессии первые две записи и тд и тп. Я понятия не имею, как это сделать с пандами, за исключением итерации по всем записям, есть ли способ для теста?