Как я мог заставить этот python код выполняться быстрее? - PullRequest
0 голосов
/ 16 марта 2020

Я удалил данные из сети и вставляю их в базу данных внутри кластера. В нем 4771 документ, и его запуск занимает так много времени, что он выполняется, пока я пишу это. Вот код:

cols = [i for i in ncaabb_player_pg_df.columns]
db.drop_collection('player_pg')
for i in ncaabb_player_pg_df.index:
    data = {}
    for k in cols:
        data = {}
        data[k] = ncaabb_player_pg_df.to_dict()[k][i]
    db.player_pg.insert_one(data)

Примечание: _id - это имя игрока, и я не хочу менять схему

1 Ответ

0 голосов
/ 16 марта 2020

Оцените все ваши комментарии.

Этот код подойдет.

cols = [i for i in ncaabb_player_pg_df.columns]
db.drop_collection('player_pg')
Dict = ncaabb_player_pg_df.to_dict()

for i in ncaabb_player_pg_df.index:
    data = {}
    for k in cols:
        data[k] = Dict[k][i]
    db.player_pg.insert_one(data)
...