Почему коэффициент кластеризации отличается от моей программы и библиотеки igraph R? - PullRequest
2 голосов
/ 07 июля 2011

Я просто пишу программу на C ++, которая вычисляет коэффициент кластеризации [ CC ] (локальный и глобальный) для неориентированного графа в формате dot . Моя проблема в том, что результат моей программы не совпадает с выводом R (с библиотекой igraph ):

Моя программа:

The cluster coefficient of "0"  is: 0.257 (88/342)
The cluster coefficient of "1"  is: 0.444 (40/90)
The cluster coefficient of "10" is: 1.000 (2/2)
The cluster coefficient of "2"  is: 0.418 (46/110)
The cluster coefficient of "11" is: 1.000 (2/2)
The cluster coefficient of "12" is: 0.667 (8/12)
The cluster coefficient of "3"  is: 0.346 (54/156)
The cluster coefficient of "5"  is: 0.571 (24/42)
The cluster coefficient of "13" is: 1.000 (12/12)
The cluster coefficient of "4"  is: 0.607 (34/56)
The cluster coefficient of "7"  is: 0.679 (38/56)
The cluster coefficient of "14" is: 1.000 (6/6)
The cluster coefficient of "15" is: 0.833 (10/12)
The cluster coefficient of "16" is: 1.000 (6/6)
The cluster coefficient of "17" is: 0.733 (22/30)
The cluster coefficient of "9"  is: 0.833 (10/12)
The cluster coefficient of "18" is: 0.714 (30/42)
The cluster coefficient of "19" is: 1.000 (6/6)
The cluster coefficient of "6"  is: 1.000 (2/2)
The cluster coefficient of "8"  is: 0.733 (22/30)

Где "" - это Узлы графа, а (n / m) - это " связи между вершинами в его окрестности" (n) и «количество ссылок, которые могут существовать между ними» (m) соответственно ( описание из Википедии ) И выход из R:

0  0.2631579        x (+2 links)
1  0.4666667        x (+2 links)
2  0.4181818
3  0.3461538
4  0.6071429
5  0.6190476        x (+2 links)
6  1.0000000
7  0.6785714
8  0.6666667        x (-2 links)
9  0.8000000
10 1.0000000
11 1.0000000
12 0.6666667
13 1.0000000
14 1.0000000
15 0.8333333
16 1.0000000
17 0.7333333
18 0.7142857
19 1.0000000

Если первое число в каждой строке - это Узел , второе - это локальное CC , а третье - это моя аннотация, когда она не соответствует моему выводу (указав количество ссылок (n), которые нужно добавить / удалить, чтобы соответствовать выводу R ).

Вторая проблема, с которой я сталкиваюсь, заключается в том, что глобальный CC из R не соответствует моему определению или Википедии *1036* (если я не неправильно понял формулу). Выход из R для этого графика составляет 0.458891 , а мой - 0.742


Итак, я сделал это вручную: я вычислил 8 CC и соответствует выводу моей программы. Поэтому мой вопрос таков: «Возможно ли, что в библиотеке igraph есть ошибка?» и если ответ «нет»: «что мне не хватает?»

Графический файл:

graph {
  1 -- 0;
  10 -- 0;
  10 -- 2;
  11 -- 0;
  11 -- 2;
  12 -- 0;
  12 -- 1;
  12 -- 3;
  12 -- 5;
  13 -- 0;
  13 -- 3;
  13 -- 4;
  13 -- 7;
  14 -- 0;
  14 -- 1;
  14 -- 4;
  15 -- 0;
  15 -- 2;
  15 -- 3;
  16 -- 0;
  16 -- 15;
  16 -- 3;
  17 -- 0;
  17 -- 1;
  17 -- 2;
  17 -- 5;
  17 -- 7;
  17 -- 9;
  18 -- 0;
  18 -- 1;
  18 -- 2;
  18 -- 3;
  18 -- 4;
  18 -- 7;
  19 -- 0;
  19 -- 18;
  19 -- 3;
  2 -- 0;
  2 -- 1;
  3 -- 0;
  3 -- 2;
  4 -- 0;
  4 -- 1;
  4 -- 3;
  5 -- 0;
  5 -- 2;
  5 -- 3;
  6 -- 0;
  6 -- 3;
  7 -- 0;
  7 -- 1;
  7 -- 2;
  7 -- 3;
  7 -- 4;
  8 -- 0;
  8 -- 1;
  8 -- 2;
  8 -- 3;
  8 -- 4;
  8 -- 5;
  9 -- 0;
  9 -- 1;
  9 -- 5;
}

То, как я вычислил CC с помощью R , загружает график (или генерирует новый, потому что он не может читать точечные файлы) в переменную "f", например, и выполнение транзитивности (f) для глобальной CC и транзитивности (f, "local") для локальной.

Большое спасибо за чтение и извините за мой плохой английский.

1 Ответ

6 голосов
/ 07 июля 2011

Один из авторов igraph здесь.

Я только что загрузил ваш график в igraph (интерфейс Python), и его результаты совпадают с вашими до последней цифры.Какую версию igraph вы используете?

Что касается «глобального» коэффициента кластеризации, обратите внимание, что существует как минимум два противоречивых определения:

  1. Расчет количества треугольниковво всей сети и деление ее на количество возможных треугольников.Это «реальный» глобальный коэффициент кластеризации, и igraph вычисляет его по умолчанию.

  2. Вычисление локальных коэффициентов кластеризации для каждого узла и взятие среднего.Это «средний локальный» коэффициент кластеризации, и вы рассчитываете его.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...