Как использовать искусственную нейронную сеть, чтобы предсказать победителя гонки на основе набора функций? - PullRequest
0 голосов
/ 06 января 2019

Предположим, что в гонке участвуют 1000 человек. Также доступны данные о различных функциях для каждого бегуна (возраст, длина ног, частота сердечных сокращений в покое и т. Д.)

Также известны победители предыдущих гонок, а также все особенности каждого участника.

Можно ли использовать искусственную нейронную сеть, чтобы предсказать победителя гонки, используя информацию прошлого?

Если так, то как бы это настроить? Будет ли первый слой узлов быть функциями? Что будет представлять выходной слой и сколько будет узлов? Пожалуйста, объясните, как будет выглядеть ANN для этих данных. Это проблема классификации?

Как будет выглядеть набор данных, поскольку цель состоит в том, чтобы выбрать одного из гонщиков? Будет ли работать, чтобы классифицировать каждого из гонщиков как «победитель» или «проигравший»? Как можно ограничить количество победителей до 1?

1 Ответ

0 голосов
/ 06 января 2019

Да, это проблема, которую ANN может решить, однако то, что у вас есть точные данные от участников, не означает, что сами данные являются достаточно сильным предиктором того, кто выиграет гонку.

Входы

Каждый узел ввода (1 для каждого типа функции, например, возраста, длины ног и т. Д.) Должен будет использовать функцию активации, которая интуитивно понятна для типа данных, с которыми вы работаете. Есть плюсы и минусы для каждого типа функции активации. Большинство людей начинают с сигмовидной или ReLU для общих проблем.

Выходы

Каждый выход будет представлять метку даты выборки (например, кто выиграл?), Поэтому должен быть выход для каждого потенциального случая. Это также означает, что да, это проблема классификации (не проблема регрессии).

Вопросы

В случае, который вы описываете, трудно предсказать исход гонки без очень большого количества особенностей. Если бы у вас было 500 бегунов и 10 функций для каждого, это означало бы, что вам нужно всего 5000 функций. И не только это - вам понадобится достаточно выборочных данных, когда все 500 бегунов соревнуются друг с другом в контролируемом случае. По понятным причинам становится проблематичным ставить проблему таким образом.

Изменить проблему

Было бы гораздо более реалистичной целью попытаться предсказать время отдельного бегуна в гонке (что может быть проблемой классификации или регрессии). Таким образом, число функций намного меньше, а зависимость от постоянных конкурентов значительно уменьшается.

...