Как оценить обнаружение сообщества без правды - PullRequest
0 голосов
/ 12 ноября 2018

Я провел обнаружение сообщества на графике и хотел бы оценить, насколько хорош мой алгоритм несколькими способами.

Прямо сейчас у меня есть начальный график и списки узлов, представляющих извлеченные сообщества. У меня нет правды относительно того, что на самом деле представляют собой эти сообщества.

Я знаю, что модульность - это хороший показатель для оценки моего алгоритма. Мне было интересно, есть ли другие (бонус, если вы знаете, где есть код для этих методов)

Спасибо!

1 Ответ

0 голосов
/ 06 декабря 2018

Модульность действительно является широко используемой мерой и имеет множество различных расширений относительно того, как вы определяете свой граф и сообщества; например, является ли ваш график направленным или ненаправленным, и являются ли ваши сообщества различными или частично совпадают. Также есть некоторые модульные метрики относительно нечеткого членства.

Но модульность сравнивает кластеризацию с произвольно генерируемым графом. В целом ведутся споры о том, насколько хороша модульность меры (см. Fortunato 2010).

Я думаю, что одним из образцовых доказательств доброты сообществ является аналогичный аргумент, но с точки зрения плотности. Одним из основных аргументов в пользу существования сообществ является тот факт, что внутри кластеров они плотнее, чем между кластерными соединениями. Таким образом, другими словами, вы можете посмотреть на плотность ссылки в сообществе и сравнить со ссылкой сообщества на внешнюю. Если вы называете плотность на уровне сети равной d, а внутри определенного кластера - d_in, а также для всего кластера и внешнего мира d_out, то у вас должно быть:

d_in > d > d_out

.

...