Подходящий формат для набора данных Google AutoML Tables - PullRequest
0 голосов
/ 14 февраля 2020

В качестве теста таблиц Google AutoML я собираюсь заменить имеющуюся у меня базу данных Access, которая выбирает стороны и прогнозирует результаты матчей по футболу с 5 сторонами.

По сути это означает, что пул игроков, которые будут разделены на команды для игры, а модель затем прогнозирует результат игры на основе состава двух сторон.

Например, на первой неделе могут быть игроки [A, B, C, D, E] против [F, G, H, I, J] со счетом 12 - 8.

На второй неделе команды могут быть [A, G, C, I, E] против [F, B, H, D, J] с оценкой 6 - 10.

В идеале модель могла бы предсказать третью неделю - каков будет результат [ A, B, C, I, J] против [F, G, H, D, E]?

У меня достаточно данных для обучения модели, но я не уверен, как лучше структурировать набор данных для достижения правильного результата. Важной информацией является общий состав игроков двух команд относительно друг друга, а не положение игрока в команде или то, был ли игрок «дома» или «в гостях», то есть:

  • С командой, состоящей из [A, B, C, D, E], обращаются так же, как с любой командой, состоящей из тех же игроков, но в другом порядке - то есть [E, D, C, B, A] или [A, C, E, B, D] и т. Д.
  • Если [A, B, C, D, E] против [F, G, H, I, J] дает оценка 11 - 9, тогда предполагается, что [F, G, H, I, J] против [A, B, C, D, E] даст оценку 9 - 11.

Любые предложения или советы высоко ценится.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...