У меня есть фрейм данных в памяти, который имеет определенные идентификаторы, используя эти идентификаторы, я хочу получать только релевантные данные из очень большой (500M строк) таблицы, сохраняемой в СУБД (Sql сервер).
Какой лучший способ сделать это? Определенно не хочу принести всю таблицу в память. И я не могу пройти через все 1009 *. Если бы это был ключ для поиска в одном столбце, я все еще мог бы подумать о создании строки, разделенной запятыми, и выполнении предложения IN для этого списка, но у меня есть несколько полей, которые являются идентификаторами.
Единственный вариант, который я вижу, - сохранение кадра данных в БД, делая соединение на сервере БД и возвращая данные обратно. Но кажется таким неуклюжим.
Я читал о dask как опцию, но не совсем уверен в этом, потому что сохранение всей таблицы в памяти / на диске все еще не кажется мне эффективным методом