Можете ли вы прогнозировать с несколькими траекториями? - PullRequest
0 голосов
/ 28 апреля 2020

Я новичок в машинном обучении временных рядов, и у меня, пожалуй, тривиальный вопрос.

Я хотел бы прогнозировать температуру для конкретного региона. Я мог обучить модель, используя почасовые данные за первые 6 дней недели, а затем оценить ее производительность в последний день. Поэтому обучающий набор будет иметь 144 точки данных (6 * 24), а тестовый набор будет иметь 24 точки данных (24 * 1). Точно так же я могу обучить новую модель для регионов БЖ и оценить каждую их индивидуальную производительность. У меня вопрос, можете ли вы обучить ЕДИНСТВЕННУЮ модель для предсказаний в разных регионах? Таким образом, метка региона должна быть входной информацией, поскольку это повлияет на изменение температуры.

Можете ли вы обучить одну модель, которая прогнозирует несколько траекторий, а не только одну? Кроме того, что может быть хорошим показателем c для оценки его производительности? Я собирался использовать среднюю абсолютную ошибку, но, возможно, корреляция лучше?

1 Ответ

1 голос
/ 28 апреля 2020

Да, вы можете тренироваться с несколькими сериями данных из разных регионов. Вопрос, который вы задаете, является конечной целью глубокого обучения, создав 1 модель для выполнения любых задач, правильного прогнозирования каждого региона и так далее. Однако, если вы хотите обобщить свою модель настолько, что вам обычно нужна действительно огромная модель, я говорю о параметре 100M ++ и для обучения этих данных вам также нужны тонны данных, возможно, пара ТБ или ПБ, поэтому вам также нужен сверхмощный компьютер, чтобы обучить эту вещь что-то вроде центра обработки данных GOOGLE. Переходя к следующему вопросу, метрике c, вы можете использовать просто простую среднеквадратическую ошибку, или средняя абсолютная ошибка будет работать нормально.

Вот то, что вам нужно сосредоточить это не супер модель, которая берет мусор и превращает его в золото, то же самое здесь мусор в мусоре. Вам нужны довольно хорошие наборы данных, которые могут представлять всю среду того, что вы пытаетесь решить. Например, вы хотите создать модель, чтобы предсказать, что если вы бьете стакан, он разобьется, поэтому у вас есть, возможно, 10 данных для каждого типа стекла, и все они разбиваются, когда вы бьете его. Итак, вы тренируете модель, и она просто предсказывает разрыв каждый раз, затем вы пытаетесь прогнозировать с помощью пуленепробиваемого стекла, и оно не разбивается, поэтому ваша модель ошибочна. Следовательно, вам нужны целые данные о другом типе стекла, тогда ваша модель может предсказать это правильно. Тогда сравните это с вашими 144 точками данных, я уверен, что это не сработает для вашего случая.

Поэтому я бы сказал, что да, вы можете построить одну модель, которая подходит всем, но за это приходится платить огромную цену.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...