Как разобрать файлы .node_labels и .edges из Citeseer / Network Repository - PullRequest
0 голосов
/ 25 апреля 2020

Я пытаюсь загрузить данные из графика Citeseer , найденного в репозитории сети.

Когда я загружаю zip-файл, я получаю два файла, citeseer.edges и citeseer.node_labels , которые, как я подозреваю, являются списками смежности и узлами с соответствующими им кромки.

Но я не уверен, как анализировать эти типы файлов с кодом Python. Если эти файлы действительно являются списками смежности, отформатированными как:

node1 adjacentNode1

node2 adjacentNode2 adjacentNode3

и файлы меток узлов, отформатированные как:

node1 nodeLabel1

node2 nodeLabel2

тогда мой текущий код может их проанализировать (если они действуют аналогично файлам .txt). Я не смог найти в Интернете ничего об этом, поэтому любая помощь будет признательна!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...