Неправильный порядок с алгоритмом Кана - PullRequest
3 голосов
/ 18 июня 2020

Я пытаюсь реализовать топологическое упорядочение с помощью алгоритма Кана:

from collections import defaultdict

def ordering(graph:dict):
    in_counts = defaultdict(int)
    for k, v in graph.items():
        if not k in in_counts:
            in_counts[k] = 0
        for in_node in v:
            in_counts[in_node] += 1

    queue = []
    for in_node in in_counts.keys():
        if in_counts[in_node] == 0:
            queue.append(in_node)

    topological_order = []

    while queue:
        print("in_counts:", in_counts)
        print("queue:", queue)
        current_node = queue.pop(0)
        topological_order.append(current_node)
        print("result:", topological_order)
        if not current_node in graph:
            continue
        for in_node in graph[current_node]:
            in_counts[in_node] -= 1
            if in_counts[in_node] == 0:
                queue.append(in_node)

    return topological_order

print(ordering({'GTTGA': ['CTGAG'], 'TTCAC': ['GTTGA'], 'AAGGC': ['GTTGA', 'TAACA', 'TTCAC'], 'CGGGC': ['GTTGA', 'TAACA'], 'CCCTC': ['GTTGA', 'TAACA', 'TTCAC', 'AAGGC', 'CGGGC', 'CTGAG'], 'AGCTT': ['GTTGA']}))

Результат отладки:

in_counts: defaultdict(<class 'int'>, {'GTTGA': 5, 'CTGAG': 2, 'TTCAC': 2, 'AAGGC': 1, 'TAACA': 3, 'CGGGC': 1, 'CCCTC': 0, 'AGCTT': 0})
queue: ['CCCTC', 'AGCTT']
result: ['CCCTC']
in_counts: defaultdict(<class 'int'>, {'GTTGA': 4, 'CTGAG': 1, 'TTCAC': 1, 'AAGGC': 0, 'TAACA': 2, 'CGGGC': 0, 'CCCTC': 0, 'AGCTT': 0})
queue: ['AGCTT', 'AAGGC', 'CGGGC']
result: ['CCCTC', 'AGCTT']
in_counts: defaultdict(<class 'int'>, {'GTTGA': 3, 'CTGAG': 1, 'TTCAC': 1, 'AAGGC': 0, 'TAACA': 2, 'CGGGC': 0, 'CCCTC': 0, 'AGCTT': 0})
queue: ['AAGGC', 'CGGGC']
result: ['CCCTC', 'AGCTT', 'AAGGC']
in_counts: defaultdict(<class 'int'>, {'GTTGA': 2, 'CTGAG': 1, 'TTCAC': 0, 'AAGGC': 0, 'TAACA': 1, 'CGGGC': 0, 'CCCTC': 0, 'AGCTT': 0})
queue: ['CGGGC', 'TTCAC']
result: ['CCCTC', 'AGCTT', 'AAGGC', 'CGGGC']
in_counts: defaultdict(<class 'int'>, {'GTTGA': 1, 'CTGAG': 1, 'TTCAC': 0, 'AAGGC': 0, 'TAACA': 0, 'CGGGC': 0, 'CCCTC': 0, 'AGCTT': 0})
queue: ['TTCAC', 'TAACA']
result: ['CCCTC', 'AGCTT', 'AAGGC', 'CGGGC', 'TTCAC']
in_counts: defaultdict(<class 'int'>, {'GTTGA': 0, 'CTGAG': 1, 'TTCAC': 0, 'AAGGC': 0, 'TAACA': 0, 'CGGGC': 0, 'CCCTC': 0, 'AGCTT': 0})
queue: ['TAACA', 'GTTGA']
result: ['CCCTC', 'AGCTT', 'AAGGC', 'CGGGC', 'TTCAC', 'TAACA']
in_counts: defaultdict(<class 'int'>, {'GTTGA': 0, 'CTGAG': 1, 'TTCAC': 0, 'AAGGC': 0, 'TAACA': 0, 'CGGGC': 0, 'CCCTC': 0, 'AGCTT': 0})
queue: ['GTTGA']
result: ['CCCTC', 'AGCTT', 'AAGGC', 'CGGGC', 'TTCAC', 'TAACA', 'GTTGA']
in_counts: defaultdict(<class 'int'>, {'GTTGA': 0, 'CTGAG': 0, 'TTCAC': 0, 'AAGGC': 0, 'TAACA': 0, 'CGGGC': 0, 'CCCTC': 0, 'AGCTT': 0})
queue: ['CTGAG']
result: ['CCCTC', 'AGCTT', 'AAGGC', 'CGGGC', 'TTCAC', 'TAACA', 'GTTGA', 'CTGAG']

Ожидаемый результат:

['CCCTC', 'CGGGC', 'AGCTT', 'AAGGC', 'TAACA', 'TTCAC', 'GTTGA', 'CTGAG']

, который отличается от моего результата (см. Выше).

Я понимаю, что CGGGC следует размещать сразу после CCCTC, однако я не понимаю, как это не противоречит алгоритму: в начале и CCCTC, и AGCTT имеют внутреннюю степень 0, а CGGGC попадает в очередь после AGCTT.

Что мне не хватает?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...