Администратор баз данных (всего 2 года обучения Google) создал массивную таблицу управления данными (108 столбцов и больше), содержащую все необходимые атрибуты для любого потока данных в системе. Ну, кратко, назовите этот стол BFT.
из этих столбцов:
10 для метаданных.
15 для источника данных и временного отслеживания
1 экземпляр столбцов new / curr для текстовых данных
10 экземпляров новых / текущих / дельта / коэффициент / столбцы диапазона для многозначных числовых обновлений
: всего 50 столбцов.
Для многозначных числовых обновлений обычно требуется только 2-5 групп обновлений.
Пакеты записей 15K-1500K загружаются в BFT и обрабатываются хранимыми процессами с логикой, чтобы проверить эти записи, перетаскивая их на постоянное хранение примерно в 30 других таблицах.
В большинстве загрузок записей 50-70 столбцов пусты в течение всего процесса.
Я не эксперт по базам данных, но эта модель и процесс, кажется, немного пахнут, но я не знаю достаточно, чтобы сказать почему, и не хочу жаловаться, не имея возможности предложить альтернативу.
Учитывая это очень маленькое понимание модели обработки данных, у кого-нибудь есть мысли или предложения? Можно ли доверять базе данных (SQL Server) для эффективной обработки записей с в основном пустыми столбцами, или обработка таким образом приводит к потере большого количества циклов / памяти и т. Д.