какая разница для подготовки данных временных рядов, чем обычные данные для машинного обучения - PullRequest
0 голосов
/ 31 мая 2019

Я не уверен, как спрашивать или искать это, любые ключевые слова или понятия приветствуются. Если бы различие природы этих двух форм данных было разработано, было бы здорово.

1 Ответ

0 голосов
/ 31 мая 2019

Обычно вы можете рассмотреть вопрос о нормализации или стандартизации ваших данных. Нормализация - это масштабирование ваших данных в диапазоне от 0 до 1, а стандартизация ваших данных - это преобразование их в нормальное распределение. Хотя последняя является более надежной для новых данных, она требует предварительного знания того, что ваши данные соответствуют нормальному распределению, что во многих случаях неверно. Нормализация требует, чтобы вы знали минимальные и максимальные значения ваших данных, но, как правило, более применимы в большинстве случаев.

Для данных временного ряда, все еще применяются два вышеупомянутых метода, но вы должны сначала убедиться, что имеете дело со стационарными данными. В противном случае «шкала», которую ваша модель выучила из обучающего набора, может не подходить для умозаключения.

Есть еще два метода для данных временных рядов: преобразование степеней и разностное преобразование.

Преобразование мощности используется для удаления изменяющейся дисперсии. Лог-преобразование, преобразование Бокса-Кокса и преобразование Йео-Джонсона являются некоторыми вариантами.

Преобразование разницы используется для удаления тренда или сезонности.

...