Как сделать сеть графов из следующего csv - PullRequest
0 голосов
/ 16 июня 2020

Я получил следующий csv-файл из scrapus. Я хочу создать сеть авторов из одной страны - например, каждый раз, когда два автора из одной страны, мы добавляем границу между ними.

Это изображение содержит скриншот файла csv

Это ссылки на полный csv, который я использую.

https://drive.google.com/file/d/1B8yaMqFu9yHQudrWI-8-mCpo6pt1T2oW/view?usp=sharing

Кроме того, знает ли кто-нибудь, как найти данные цитирования для статьи ['eid] и проанализировать такие данные, как:

следующую таблицу:

author   cited-by author   paper    auth-university     auth-country

Идея в том, что иметь сеть авторов и соавторов, где, если у каждого автора есть соответствующее значение в столбце цитируемого автора, добавляется ребро.

1 Ответ

0 голосов
/ 17 июня 2020

Вы можете использовать внутреннее соединение по стране, чтобы получить края:

import pandas as pd
data = pd.read('/path/to/file.csv')
combinations = pd.merge(data, data, how='inner', on='country')
edges = combinations['author_x', 'author_y']
...