У нас есть несколько служебных скриптов в Visual FoxPro, которые мы используем для интерактивной очистки / форматирования данных. Мы хотели бы начать миграцию этого кода, чтобы использовать другие платформы баз данных, такие как MySQL или SQLite.
Например, у нас есть скрипт, который мы запускаем, который преобразует строки имени и / или адреса в правильный верхний / нижний регистр. Этот код проходит всю таблицу и анализирует / исправляет каждую строку. Есть другие, которые делают такие вещи, как анализ и стандартизацию адреса и даже обнаружение дубликатов ...
Мы подумываем о переносе кода в Python и, возможно, использовать что-то вроде SQLAlchemy в качестве «посредника».
В Visual FoxPro база данных / таблицы интегрированы, поэтому мы можем просто открыть таблицу и выполнить команды. MySQL отличается тем, что нам нужно извлечь из него данные, затем поработать с этими извлеченными данными, а затем обновить таблицу.
Какой будет лучший подход?
Я вижу несколько возможностей:
1) Извлеките весь набор данных для обработки, скажем, все поля адреса, если это то, с чем мы будем работать, затем обновите все и запишите все обратно ...
2) Извлечь набор данных в виде фрагментов, чтобы потенциально не потреблять огромные объемы системной памяти ... затем обновить и записать обратно
3) Создание кода SQL, возможно, с помощью такого инструмента, как SQLAlchemy, который отправляется и выполняется сервером ...
4) ??? Что-нибудь еще, о чем я не думал?