Жакард Расстояние - PullRequest
       7

Жакард Расстояние

3 голосов
/ 07 декабря 2010

У меня есть эта проблема при расчете расстояния Жакара для множеств (бит-векторов):

p1 = 10111;

p2 = 10011.

Размер пересечения = 3;(Как мы можем это выяснить?)

Размер объединения = 4, (Как мы можем это выяснить?)

Сходство Жаккара = (пересечение / объединение) = 3 / 4.

Расстояние Джакарда = 1 - (сходство Джакарда) = (1-3 / 4) = 1 / 4.

Но я не понимаю, как мы могли бы найти пересечение "" и " объединение " двух векторов.

Пожалуйста, помогите мне.

Большое спасибо.

Ответы [ 2 ]

6 голосов
/ 07 декабря 2010

Размер пересечения = 3; (Как мы можем это выяснить?)

Количество установленных бит p1&p2 = 10011

Размер объединения = 4, (Как мы можем это выяснить?)

Количество установленных бит p1|p2 = 10111

Вектор здесь означает двоичный массив, где i-й бит означает, присутствует ли i-й элемент в этом наборе.

2 голосов
/ 14 ноября 2013

Если p1 = 10111 и p2 = 10011,

Общее количество атрибутов каждой комбинации для p1 и p2:

  • M11 = общее количество атрибутов, где p1 & p2 имеютзначение 1,
  • M01 = общее количество атрибутов, где p1 имеет значение 0 & p2 имеет значение 1,
  • M10 = общее количество атрибутов, где p1 имеет значение 1 & p2 имеетзначение 0,
  • M00 = общее количество атрибутов, где p1 и p2 имеют значение 0.

коэффициент подобия Жакара = J = пересечение / объединение = M11 / (M01 + M10+ M11) = 3 / (0 + 1 + 3) = 3/4,

расстояние Жакара = J '= 1 - J = 1 - 3/4 = 1/4, или J' = 1 -(M11 / (M01 + M10 + M11)) = (M01 + M10) / (M01 + M10 + M11) = (0 + 1) / (0 + 1 + 3) = 1/4

...