Эффективная корреляция ранжированных списков для> 100 тыс. Элементов - PullRequest
0 голосов
/ 11 марта 2020

Фон

Учитывая 2 ранжированных списка - нам нужно измерить их сходство.

Как обсуждалось в в этом вопросе , существуют некоторые алгоритмы, такие как Кендалл ранговый коэффициент корреляции или ранговое смещенное перекрытие.

Проблема

И Тау Кендалла, и RBO (упомянутые выше) немного медленны, когда речь идет о списках из ~ 100 тыс. элементов.

Вопрос

Какие оптимизации мы можем использовать для ускорения работы со списками из более чем 100 тыс. Элементов? (Компромисс с точностью алгоритма принят).

...