Какая разница между расстоянием Кендалла и Тау Кендалла? - PullRequest
0 голосов
/ 09 февраля 2019

Я сейчас пытаюсь использовать расстояние Кендалла для улучшения наборов ранжирования на основе метода подсчета Борды.

Меня просят следовать инструкциям конкретного документа.В документе говорится, что:

"Расстояние Кендалла учитывает парные разногласия между предметами из двух рангов как: enter image description here

, где

enter image description here Расстояние Кендалла нормализуется по его максимальному значению C2n. Чем меньше расстояние Кендалла, тем больше степень подобия ранжирования.

Тау Кендалла является еще одним методом дляизмерение степени сходства между рейтингами, которое легко спутать с расстоянием Кендалла Тау Кендалла определяется как: enter image description here

Тау Кендалла определяется на основе нормализованного Кендалларасстояние. Обратите внимание, что чем больше тау Кендалла, тем больше степень сходства сравниваемых ранжирований. В этой статье мы используем расстояние Кендалла, а не тау Кендалла. "

Моя цель - улучшитьследующий рейтинг с использованием расстояния Кендалла:

    x1 x2 x3 x4
A1  4  1  3  2
A2  4  1  3  2
A3  4  3  2  1
A4  1  4  3  2
A5  1  2  4  3

В этом рейтинге строка i представляет ранжирование, полученное на основе A i , и каждый столбец представляет позицию ранжирования соответствующего элемента в каждом ранжировании.(т. е. x n представляет элементы для оценки, A i представляет элементы, которые ранжируют элементы.)

Я не понимаю, в чем разница междудва расстояния, несмотря на объяснение док.А что означает "(j, s), j! = S" под символом сигмы?И, наконец, как реализовать дистанцию ​​Кендалла в приведенном выше рейтинге?

1 Ответ

0 голосов
/ 09 февраля 2019

Расстояние и сходство - это две взаимосвязанные концепции, но для расстояния точная идентичность означает расстояние 0, и, когда вещи становятся все более разными, расстояние между ними становится больше, без очевидного фиксированного предела.Хорошее поведение расстояния будет подчиняться правилам для метрики - см. https://en.wikipedia.org/wiki/Metric_(mathematics). Для сходства точная идентичность означает сходство 1, и сходство уменьшается, когда вещи становятся больше, но обычно никогда не уменьшается ниже 0. Тау Кендалла, кажется,способ превратить расстояние Кендалла в подобие.

"(j, s), j! = s" означает рассмотреть все возможности для j и s, кроме тех, для которых j = s.

Вы можете вычислить расстояние Кендалла, просто суммируя все возможности для j, не равного s - но время, затрачиваемое на это, увеличивается с квадратом количества предметов.Есть способы, за которые время увеличивается только как n * log (n), где n - количество элементов - для этого и многих других вещей в Кендалле см. https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient

...