Я сейчас пытаюсь использовать расстояние Кендалла для улучшения наборов ранжирования на основе метода подсчета Борды.
Меня просят следовать инструкциям конкретного документа.В документе говорится, что:
"Расстояние Кендалла учитывает парные разногласия между предметами из двух рангов как:
, где
Расстояние Кендалла нормализуется по его максимальному значению C2n. Чем меньше расстояние Кендалла, тем больше степень подобия ранжирования.
Тау Кендалла является еще одним методом дляизмерение степени сходства между рейтингами, которое легко спутать с расстоянием Кендалла Тау Кендалла определяется как:
Тау Кендалла определяется на основе нормализованного Кендалларасстояние. Обратите внимание, что чем больше тау Кендалла, тем больше степень сходства сравниваемых ранжирований. В этой статье мы используем расстояние Кендалла, а не тау Кендалла. "
Моя цель - улучшитьследующий рейтинг с использованием расстояния Кендалла:
x1 x2 x3 x4
A1 4 1 3 2
A2 4 1 3 2
A3 4 3 2 1
A4 1 4 3 2
A5 1 2 4 3
В этом рейтинге строка i представляет ранжирование, полученное на основе A i , и каждый столбец представляет позицию ранжирования соответствующего элемента в каждом ранжировании.(т. е. x n представляет элементы для оценки, A i представляет элементы, которые ранжируют элементы.)
Я не понимаю, в чем разница междудва расстояния, несмотря на объяснение док.А что означает "(j, s), j! = S" под символом сигмы?И, наконец, как реализовать дистанцию Кендалла в приведенном выше рейтинге?