Вы хотите сгенерировать данные временных рядов, которые будут вести себя как некоторые существующие данные временных рядов, которые у вас есть из реальных явлений (погода и фондовая биржа).Эти сгенерированные данные временного ряда будут поданы в некоторую систему для проверки ее стабильности.
Что вы можете сделать: приспособить какую-либо модель к имеющимся данным, а затем использовать эту модель для генерации данных, следующих за моделью, иследовательно ваши существующие данные.Подгонка данных к модели дает набор параметров модели и набор отклонений (различия, не объясняемые моделью).Отклонения могут следовать за некоторой известной функцией плотности, но не обязательно.Учитывая параметры модели и отклонения, вы можете генерировать данные, которые выглядят как исходные данные.Обратите внимание, что если модель плохо объясняет данные, отклонения будут большими, и данные, сгенерированные с помощью модели, не будут выглядеть как исходные данные.
Например, если вы знаете, что ваши данные линейны, выпроведите линию через них, и ваша модель будет иметь вид:
y = M x + B + E
, где E
- случайная величина, которая следует за распределением ошибки вокруг линии, которая соответствует вашим данным, а где M
иB
- параметры модели.Теперь вы можете использовать эту модель для генерации (x, y)
координат, которые являются линейно линейными.При выборке случайной величины E
вы можете предположить, что она следует некоторому известному распределению, например нормальному распределению, или использовать гистограмму для генерации отклонений, которые следуют за произвольными функциями плотности.
Существует несколько моделей временных рядов, которыеВы можете использовать, чтобы соответствовать вашей погоде и данных биржи.Вы можете посмотреть на экспоненциальное сглаживание .У него есть несколько разных моделей.Я уверен, что вы можете найти много других моделей в Википедии.
Если модель не подходит вашим данным, вы также можете увидеть ее параметры в качестве случайных величин.В нашем примере выше, предположим, что мы наблюдали данные, когда кажется, что наклон меняется.Мы бы поместили несколько строк и получили бы распределение для M
.Затем мы сэмплируем эту переменную вместе с E
при генерации данных.