Хотите использовать пошаговые последовательные данные и длительность точки для классификации стилей игры. Какие техники я могу применить? - PullRequest
0 голосов
/ 06 мая 2020

У меня есть набор данных матчей по пинг-понгу и пошаговых данных в формате последовательности вместе с соответствующей продолжительностью.

например, "RRSRSRSRSRSRSRRSSRS,SRSSSSSRSRSSRSSSSSRS,SRRSRSRSRSSSSRSRRSSSRRSR", где 'S': сервер выиграл очко, ' R ': сервер потерял точку,', 'конец набора (сервер меняет каждые 2 балла в пинг-понге, если только не go на дополнительные баллы, где изменение происходит на каждую точку)

"[100, 12, 21, 17, 16, 23, 13, 17, 19, 19, 14, 17, 17, 14, 12, 13, 36, 25, 25, 8, 11, 13, 17, 16, 15, 23, 12, 13, 16, 15, 9, 22, 13, 17, 23, 19, 20, 26, 32, 2, 14, 11, 8, 12, 11, 36, 13, 17, 24, 22, 14, 37, 18, 16, 4, 26, 27, 31, 17, 22, 22, 19, 30]", продолжительность каждая точка в секундах

, а затем из приведенных выше данных я сделал некоторые другие отформатированные по-другому, чтобы упростить задачу. В моем наборе данных намного больше функций, одна из которых важна для упомянутых выше - кто обслуживает первым, поэтому я могу перебирать строки последовательности и получать некоторую статистику игроков, связанную с очками. Другие функции, которые могут быть полезны с вышеуказанным: процент подачи, процент возврата, возраст, общее количество матчей.

Я думал, могу ли я с помощью приведенных выше данных классифицировать игроков по разным стилям игры. Я думаю, что в пинг-понге есть в основном «атакующий» и «оборонительный» стили игры. Некоторые предположения, которые я могу сделать, следующие: а) Я не могу знать, как оценивается каждое очко (ошибка игрока или противник действовал правильно?), Только кто его выиграл, поэтому мне нужно игнорировать «как» б) Но я могу подсчитывать очки это заняло менее 5 секунд (на самом деле я наблюдал какие-то «5 секундные» точки, и на самом деле они длятся 1-2 секунды, поэтому есть некоторое запаздывание ввода) по вине оппонента, то есть точки заканчиваются первым ударом сервера после подачи c) Установите предел между 10-15 секундами для точек, которые будут классифицироваться как точки «до 3-го удара», так что 5-15 секунд d) Очки выше предыдущего лимита будут классифицированы как «розыгрыши»

Основываясь на моем исследовании стилей игры, кажется, что менее опытные игроки, как правило, практикуют «розыгрыши», когда более опытные игроки, как правило, лучше набирают очки «до 3-го удара». В статистике c я видел онлайн примерно 50% очков заканчиваются «до 3-го удара», а остальные заканчиваются после розыгрыша.

Моя гипотеза состоит в том, что, основываясь на вышеизложенном, я бы ожидайте, что защитник будет играть больше розыгрышей, а нападающий - постараться набрать очки как можно быстрее. Кроме того, возможно, есть некоторая корреляция с усталостью (как у игроков старшего возраста, больше сетов) и тем, как это влияет на стиль игры. Итак, я хочу попробовать классифицировать / кластеризовать игроков на основе приведенных выше данных, но я не уверен, с чего начать. Не могли бы вы дать мне какое-нибудь руководство относительно теории или того, какие алгоритмы / методы мне следует искать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...