Эффективный способ доступа к отображению идентификаторов в Python - PullRequest
3 голосов
/ 05 июня 2010

Я пишу приложение для преобразования файлов, и частично заменяю старые номера счетов новыми номерами.

Прямо сейчас у меня есть файл CSV, отображающий старые и новые номера счетов с записями около 30 КБ. Я читаю это и сохраняю как dict, а при записи нового файла извлекаю новую учетную запись из dict по ключу.

Мой вопрос: каков наилучший способ сделать это, если CSV-файл увеличивается до 100K + записей?

Было бы более эффективно преобразовывать сопоставления учетных записей из CSV в базу данных sqlite, а не сохранять их как данные в памяти?

1 Ответ

1 голос
/ 05 июня 2010

Пока все они помещаются в памяти, dict будет самым эффективным решением. Это также намного проще для кода. 100k записей на современном компьютере не должно быть проблемой.

Вы правы, что переключение на базу данных SQLite является хорошим выбором, когда число записей становится очень большим.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...