У меня есть timeseries = (training, test)
, а затем я использовал оператор Pandas .diff()
для training
части временных рядов (diff_training_ts
), чтобы сделать мой временной ряд стационарным, а затем я предсказал значения теста, используя diff_training_set
.
Очевидно, мои предсказанные значения еще не верны, я должен integrate
их.
И теперь я хотел бы вычислить sqrt(rmse(test, predicted))
, проблема в том, что я должен восстановитьистинные значения, и я написал кусок кода, используя cumsum()
и другие, но это выглядит странно (и тоже есть ошибка).Есть ли в Pandas хороший ярлык для такого рода операций?
UPD : Вот результат, если я удаляю cumsum: imgur.com/a/OEiDXXk Но вот пример: исходные данные:df = 3 10 12 15 4
, где {3, 10, 12} = training
, {15, 4} = test
.После df = df.diff()
-> diff = {NaN 7 2 3 -11}
-> diff_training = {7, 2}
, diff_test = {3, -11}
-> diff_test.cumsum() = {3, -8}
, seed = 3
, term_to_add = 12
и затем для получения истинных тестовых значений мы можем test = {3 + 12, -8 + 12}
.