Расчет «стоимости» отдельных команд из комбинированных результатов - PullRequest
1 голос
/ 15 марта 2012

У меня есть целая куча данных из серии раундов. В частности, у меня много наборов сумм очков трех команд за раунд (результаты не сообщаются индивидуально, только как команда).

Например, я знаю, что команды 1, 7, 3 вместе заработали 40 очков в 1 раунде, а команды 1, 2,7 вместе заработали 50 очков в 2 раунде.

Я хотел бы использовать эти данные, чтобы определить, какая команда является лучшей. Мой текущий метод состоит в том, чтобы найти средний счет команд в матчах, в которых они соревновались. Однако это довольно неточно (результаты тестовых данных плохо коррелировали с финальным размещением в последнем туре)

Я подумал о том, чтобы сформировать серию уравнений и использовать матрицу для решения этой проблемы, но команды не набирают один и тот же результат каждый раз (это данные реального мира).

Итак, есть ли лучшая формула для расчета "стоимости" этих команд?

1 Ответ

1 голос
/ 17 марта 2012

Поскольку мы хотим найти «ценность» команд, нам нужно лучше определить ее. Пусть w (n) обозначает ценность команды n.

Если мы предположим, что счет в каждом раунде прямо пропорционален значению команды, мы можем построить следующий набор уравнений:

  • ш (1) + W (7) + W (3) = 40 * 1 006 *
  • ш (1) + W (2) + W (7) = 50

В соответствии с системой уравнений мы можем иметь точное решение.

Однако лучшей моделью было бы предположить, что ценность команды g является [обычно / геометрической / другой] -распределенной переменной со средним значением w (g), и что фактический счет в каждой игре является случайной выборкой (которая неизвестно). Пусть X (n, g) обозначает случайную выборку n группы g. Следовательно,

  • Х (1,1) + X (1,7) + X (1,3) = 40
  • Х (2,1) + X (1,2) + X (2,7) = 50

Полагаю, эта модель более точна, но для оценки ценности каждой команды требуется гораздо более сложная математика.

...