Создание двудольного графа networkx с набором данных Stack Overflow> 5 м, требуются советы и рекомендации - PullRequest
0 голосов
/ 29 августа 2018

Я делаю проект о визуализации данных и sna, и я работаю с набором временных сетевых данных Stack Overflow (http://snap.stanford.edu/data/sx-stackoverflow.html). Набор данных представляет взаимодействия между пользователями в переполнении стека, Например, пользователь A ответил на вопрос пользователя B. В определенное время я уже сделал тепловые карты, отслеживающие наиболее заметную активность пользователей, и у меня есть другая идея - представить набор данных в виде двудольного графа. Я новичок в NetworkX, и я хотел бы получить совет, чтобы знать, правильно ли я думаю, и можно ли интерпретировать мою идею, и каков наилучший способ (примеры с большими наборами данных и аналогичными проблемами были бы очень полезны). Так, У меня есть Пользователь A и Useb B в качестве узлов, и граница между ними - время. У меня ~ 5м узлов. Я хотел бы представить соединения в виде двудольного графа из-за структуры набора данных. Данные несбалансированы,> 95% - это пользователи, которые спросили / ответили только один раз. Моя идея визуализации заключалась в том, чтобы получить нечто похожее на это:

enter image description here

Возможно ли это? Если да, можете ли вы дать мне пример, как сделать визуализацию. Как лучше всего это представить?

Буду признателен за любую помощь. Спасибо!

...