Извините, если это грубо: это мой первый пост в Stackoverflow! Я заранее извиняюсь за то, что не публикую код, но все, что я делаю, не является сложным (и, возможно, в этом проблема), поэтому описание должно работать. Я также извиняюсь, если я плохо описываю проблемы, потому что я новичок в Python; Я не совсем уверен, как воссоздать пример без данных уже: (
При использовании NetworkX я часто запускаю большие неориентированные графы (назовем их G) с тысячами узлов после импорта данных из панд. Большинство узлов VAST имеют только один или два ребра, что для меня просто шум. Меня интересуют кластеры с множеством узлов, и это на самом деле меньшинство.
Таким образом, я затем запущу команду nx.connected_components
, чтобы составить длинный список всех наборов подграфов, содержащихся в G, просмотреть лучшие результаты и распечатать отдельные подграфы, которые меня интересуют, по одному за раз.
Таким образом, когда я получу свой список / словарь генератора всех подграфов подключенных компонентов (который, как правило, очень длинный), я обычно просто смотрю на первые 50-100 результатов. Потому что они, как правило, имеют то, что я ищу.
Я пытался nx.connected_component_subgraphs
, но мне так много не нужно, что это почти так же плохо, как просто визуализировать всю сеть сразу.
Итак, вкратце: как я могу взять генератор / список наборов, которые nx.connected_components
дает мне - которые я затем сокращаю до лучших 50 - и превратить это в новый граф?
Я попытался преобразовать вывод nx.component_components
в список, но все готово.
Нет сообщений об ошибках.