Вычисление степени сходства среди групп множеств - PullRequest
4 голосов
/ 10 января 2010

Предположим, есть 4 набора:

s1 = {1,2,3,4};
с2 = {2,3,4};
s3 = {2,3,4,5};
s4 = {1,3,4,5};

Существует ли какая-либо стандартная метрика для представления степени сходства этой группы из 4 наборов?

Спасибо за предложение метода Жакара. Тем не менее, кажется, что попарно. Как я могу вычислить степень подобия всей группы множеств?

Ответы [ 5 ]

8 голосов
/ 10 января 2010

Попарно, вы можете вычислить расстояние Джакарта из двух наборов.Это просто расстояние между двумя наборами, если они были векторами логических значений в пространстве, где {1, 2, 3…} - все единичные векторы.

2 голосов
/ 10 января 2010

Как сказал Тобу, я бы использовал Индекс Жакара , который является просто пересечением, деленным на объединение множеств.

2 голосов
/ 10 января 2010

Ваш вопрос не очень конкретный. Но я полагаю, вы имеете в виду что-то вроде «расстояния редактирования» между ними? То есть сколько нужно поменять s1, чтобы добраться до s2?

Ознакомьтесь со статьей в Википедии Изменить расстояние .

0 голосов
/ 10 января 2010

Вы можете вычислить евклидово расстояние между ними и построить дендрограмму из этого, чтобы визуализировать сходство.

0 голосов
/ 10 января 2010

вы можете вычислить размер пересечения между каждым множеством

...