Обычно вы можете рассмотреть вопрос о нормализации или стандартизации ваших данных. Нормализация - это масштабирование ваших данных в диапазоне от 0 до 1, а стандартизация ваших данных - это преобразование их в нормальное распределение. Хотя последняя является более надежной для новых данных, она требует предварительного знания того, что ваши данные соответствуют нормальному распределению, что во многих случаях неверно. Нормализация требует, чтобы вы знали минимальные и максимальные значения ваших данных, но, как правило, более применимы в большинстве случаев.
Для данных временного ряда, все еще применяются два вышеупомянутых метода, но вы должны сначала убедиться, что имеете дело со стационарными данными. В противном случае «шкала», которую ваша модель выучила из обучающего набора, может не подходить для умозаключения.
Есть еще два метода для данных временных рядов: преобразование степеней и разностное преобразование.
Преобразование мощности используется для удаления изменяющейся дисперсии. Лог-преобразование, преобразование Бокса-Кокса и преобразование Йео-Джонсона являются некоторыми вариантами.
Преобразование разницы используется для удаления тренда или сезонности.