Расчет проекции двудольного графа занимает огромное количество времени - PullRequest
0 голосов
/ 26 апреля 2019

Я использую этот набор данных: https://www.kaggle.com/rdoume/beerreviews Он имеет 1,5 миллиона строк. Я создаю график с использованием Networkx, как это:

beerid_series = beer_reviews['beer_beerid']
profilename_series = beer_reviews['review_profilename']
beer_review_edges = [(row["beer_beerid"],row["review_profilename"]) for 
idx,row in beer_reviews.iterrows()]
BeerGraph = nx.Graph()
BeerGraph.add_nodes_from(beerid_series,bipartite=0)
BeerGraph.add_nodes_from(profilename_series,bipartite=1)
BeerGraph.add_edges_from(beer_review_edges)

и для создания прогнозируемого графика я делаю это:

Beer_Projected_G = bipartite.projected_graph(BeerGraph, beerid_series)

Для создания этого прогнозируемого графика требуется очень много времени. Что-то не так с моей реализацией моего кода, или я должен что-то сделать, чтобы улучшить скорость вычисления?

Спасибо

...