Предсказать результаты прыжков в длину: это проблема прогнозирования временных рядов или проблема регрессии? - PullRequest
0 голосов
/ 23 апреля 2020

Вот мои данные (упрощенно):

Athletics    Age    Competition    Result(m)
--------------------------------------------
Alex         10.2    CompA          3.2
Alex         11.5    CompB          4.3
...
Bob          9.9     CompC          3.5
Bob          10.7    CompD          5.6
...
Dave         10.3    CompB          5.2
Dave         11.6    CompD          6.3
....

Итак, мои данные о наборе детей разного возраста (8-28) - результаты прыжков в длину в разных соревнованиях.

Что я хочу знать:

  1. Учитывая нового ребенка Пола, если мы знаем его историю (например, 8 - 16 лет), как предсказать его будущий результат (скажем, в возраст 18, 20, 24)
  2. Если мы сможем сгруппировать перемычки в АЕ, основываясь на их лучших результатах, как предсказать, в какой группе Пол будет в будущем (скажем, когда ему исполнится 18 лет)?

Я недавно Я немного освоил машинное обучение и глубокое обучение, и я знаю, что эту проблему можно решить с помощью этих моделей, но я не совсем понимаю, какие модели мне следует использовать.

  1. Должен ли я сделать прогноз для Пола (нового ребенка) ТОЛЬКО на основании данных истории Павла? Или я должен делать это, используя чужие данные, такие как Алекс, Боб, Дэйв?
  2. Это проблема прогнозирования временных рядов, когда я должен был использовать такие модели, как ARIMA, ARCH, LSTM (RNN)?
  3. Или это «нормальная» контролируемая или неконтролируемая регрессия или проблема классификации, где я должен был использовать модели учебников, такие как линейная регрессия, логистика c регрессия, KNN, NB, DT, SVM, случайный лес, ANN, DNN, CNN?

Любое направление будет с благодарностью.

1 Ответ

0 голосов
/ 23 апреля 2020

Ответ - оба. Регрессия просто означает, что на выходном слое модели отсутствует сигмовидная активация. Таким образом, вы можете использовать модель временных рядов, такую ​​как LSTM или GRU (это может привести к переоснащению для использования такой сложной модели), а затем использовать их для выполнения регрессии. Таким образом, модель узнает, как другие дети выполняют, а затем использует данные Пола, чтобы предсказать, насколько хорошо он будет выполнять. Это не проблема классификации! Вы предсказываете продолжение значения, а не классы. Это означает, что это должен быть регресс.

Я бы посоветовал читать книги или брать уроки, мне нравится Deep Learning с Python.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...