Как мне использовать экзогенную переменную с pipe.fit () в библиотеке pmdarima? - PullRequest
1 голос
/ 03 мая 2019

В настоящее время я строю модель ARIMAX с библиотекой pmdarima, используя pmdarima.pipeline.Pipeline.fit (y, exogenous = None, ** fit_kwargs)

Параметр описан:

экзогенный: похожий на массив, shape = [n_obs, n_vars], необязательный (по умолчанию = None)

An optional 2-d array of exogenous variables. If provided, these variables are used as additional features in the regression operation. This should not include a constant or trend. Note that if an ARIMA is fit on exogenous features, it must be provided exogenous features for making predictions.

Но я не понимаю, что означает этот формат: shape = [n_obs, n_vars].

Что означает n_obs и n_vars?

И зачем нам нужен этот формат, а не экзогенная переменная в формате временного ряда?

спасибо за вашу помощь

1 Ответ

0 голосов
/ 07 мая 2019

Мистер Тейлор Смит прислал мне письмо.

Надеюсь, что это может помочь кому-то еще в будущем

экзогенные переменные, или ковариаты, представлены в виде двухмерных матриц большинству алгоритмов ML, как я уверен, вы знаете. Вдоль оси строк - наблюдения, а вдоль оси столбцов - переменные или векторы объектов (отсюда n_samples x n_features). Соглашение, о котором вы спрашиваете, - это соглашение, которое Numpy и scikit-learn используют для обозначения формы объекта, подобного массиву (см., Например, документацию по Lasso scikit-learn). «shape = [n_obs, n_vars]» просто означает двумерную матрицу с выборками по строкам и переменными по столбцам.

Что касается вашего вопроса о том, почему вы не можете использовать временные ряды ... ваша переменная y должна быть временным рядом (на самом деле это просто вектор или 1-й массив), так как это то, что вы собираетесь прогнозировать из , Это единственная необходимая часть данных. Экзогенные переменные являются чисто необязательными частями дополнительных данных.

...