Как следует интерпретировать Скорректированный индекс Рэнда (ARI) в проблеме кластеризации? - PullRequest
0 голосов
/ 28 января 2020

Я работал над алгоритмом кластеризации с 6900 выборками для двух кластеров. Я использовал ARI для анализа производительности моего алгоритма кластеризации и получил 0,52.

Моя проблема с интерпретацией этого числа. Могу ли я извлечь из этого разумный смысл? Или «чем позитивнее, тем лучше» обоснование.

1 Ответ

1 голос
/ 29 января 2020

Вы вычисляете ARI с вашим результатом кластеризации и некоторым другим назначением метки. ARI сообщает вам, насколько близок ваш результат к этому другому назначению метки, с поправкой на вероятность случайных правильных догадок. Более высокий положительный ARI означает более высокую согласованность между двумя обозначениями.

...