Я пытаюсь создать график в igraph, используя CSV-файл, который выглядит следующим образом:
ID Element1 Element2 Element3 Element4
12346 A 12 56 2
13007 Y 16 66 2
... ... ... ... ...
Столбец ID заполняется уникальными 4-значными идентификаторами, тогда как столбцы элементов заполняются числами (или буквы в элементе 1), которые повторяются.Моя цель состоит в том, чтобы вычислить попарно подобие Жакара всех идентификаторов, которое использует элементы, совместно используемые узлами идентификаторов.На выходе должна быть матрица NxN.
Я пытался создать график на igraph, используя функцию graph_from_data_frame
, но это создает узлы из первых двух столбцов и помещает оставшиеся столбцы в качестве атрибутов ребра в отношениях между узлами, которые он создает.Любые идеи о лучшем способе создания графа, который позволит мне вычислить Jaccard между узлами идентификатора?
Для справки, цель состоит в том, чтобы использовать эту функцию igraph:
similarity(graph, vids = V(graph), mode = c("all", "out", "in", "total"),
loops = FALSE, method = c("jaccard", "dice", "invlogweighted"))
где graph
- график, который я создаю, а vids
являются только узлами идентификатора.