Я использую этот набор данных: https://www.kaggle.com/rdoume/beerreviews
Он имеет 1,5 миллиона строк.
Я создаю график с использованием Networkx, как это:
beerid_series = beer_reviews['beer_beerid']
profilename_series = beer_reviews['review_profilename']
beer_review_edges = [(row["beer_beerid"],row["review_profilename"]) for
idx,row in beer_reviews.iterrows()]
BeerGraph = nx.Graph()
BeerGraph.add_nodes_from(beerid_series,bipartite=0)
BeerGraph.add_nodes_from(profilename_series,bipartite=1)
BeerGraph.add_edges_from(beer_review_edges)
и для создания прогнозируемого графика я делаю это:
Beer_Projected_G = bipartite.projected_graph(BeerGraph, beerid_series)
Для создания этого прогнозируемого графика требуется очень много времени. Что-то не так с моей реализацией моего кода, или я должен что-то сделать, чтобы улучшить скорость вычисления?
Спасибо