Я работаю над проектом по управлению персоналом, где я должен взять навыки сотрудников и соотнести их таким образом, чтобы я мог создать таксономию навыков.Я решил создать неориентированный сетевой график, в котором каждый раз, когда два навыка объединяются в наборе навыков сотрудника, он проводит грань между ними, и вес этого - то, сколько раз эти связанные навыки приобретаются сотрудниками.
В этом графе около 8000 узлов и миллионов соединений.Моя следующая задача - сгруппировать этот график таким образом, чтобы я мог видеть, какие навыки похожи.
Проблема заключается в том, что все алгоритмы (например: подключенные компоненты подграфа, кластеризация и т. Д.), Представленные в NetworkX, работают только для 2000 узлов.Когда я пытаюсь увеличить количество узлов, я не получаю четких результатов.
Есть ли способ кластеризации на 8000 очень подключенных узлов?Какие-либо предложения?Я работаю в Python.