Получить вес узла для простого двудольного графа - PullRequest
1 голос
/ 14 марта 2020

Я создал двудольный график networkx из файла CSV, который отображает расстройства на симптомы. Таким образом, расстройство может быть связано с одним или несколькими симптомами.

for disorder, symptoms in csv_dictionary.items():
    for i in range (0, len(symptoms)):
        G.add_edge(disorder, symptoms[i])

Мне нужно найти, какие симптомы связаны с множественными заболеваниями, и отсортировать их по весу. Есть предложения?

1 Ответ

1 голос
/ 14 марта 2020

Вы можете использовать degree созданного графика. Каждый симптом со степенью больше 1 относится как минимум к двум болезням:

Я добавил несколько примеров csv_dictionary (просьба указать его в следующем вопросе в качестве минимального воспроизводимого примера) и создал набор всех симптомов во время создание графа. Вы также можете подумать о добавлении этой информации в качестве элемента узла на график.

import networkx as nx

csv_dictionary = {"a": ["A"], "b": ["B"], "c": ["A", "C"], "d": ["D"], "e": ["E", "B"], "f":["F"], "g":["F"], "h":["F"]}

G = nx.Graph()

all_symptoms = set()
for disorder, symptoms in csv_dictionary.items():
    for i in range (0, len(symptoms)):
        G.add_edge(disorder, symptoms[i])

        all_symptoms.add(symptoms[i])

symptoms_with_multiple_diseases = [symptom for symptom in all_symptoms if G.degree(symptom) > 1]
print(symptoms_with_multiple_diseases)
# ['B', 'F', 'A']

sorted_symptoms = list(sorted(symptoms_with_multiple_diseases, key= lambda symptom: G.degree(symptom)))
print(sorted_symptoms)
# ['B', 'A', 'F']
...