Я удалил данные из сети и вставляю их в базу данных внутри кластера. В нем 4771 документ, и его запуск занимает так много времени, что он выполняется, пока я пишу это. Вот код:
cols = [i for i in ncaabb_player_pg_df.columns]
db.drop_collection('player_pg')
for i in ncaabb_player_pg_df.index:
data = {}
for k in cols:
data = {}
data[k] = ncaabb_player_pg_df.to_dict()[k][i]
db.player_pg.insert_one(data)
Примечание: _id - это имя игрока, и я не хочу менять схему