У меня есть локальный фрейм данных Python Pandas на моем локальном компьютере, и у меня есть доступ к удаленному серверу mongodb, у которого есть дополнительные данные, которые я могу запросить через pymongo.
Если мой локальный фрейм данных большой, скажем, 40k строк с3 столбца в каждой строке, какой самый эффективный способ проверить пересечение функций моего локального информационного кадра и удаленную коллекцию, содержащую миллионы документов?
Я ищу общие советы здесь.Я подумал, что мог бы просто взять отдельный список значений из каждой из 3 функций и использовать каждое из них в выражении $ или find, но если у меня есть 90k различных значений для одной из 3 функций, это кажется плохой идеей.
Так что любое мнение будет приветствоваться.У меня нет доступа для вставки локального фрейма данных на удаленный сервер, у меня есть только выбор / поиск доступа.
большое спасибо!