Я - разработчик (не dba), работающий над проектом, в котором мы управляли «обновлениями» данных посредством массовой вставки. Однако сначала мы вставляем в неиндексированную «предварительную» таблицу. Это связано с тем, что нам нужно нормализовать много денормализованных данных и убедиться, что они правильно разделены на нашу схему.
Естественно, это замедляет процессы обновления и вставки, поскольку мы должны проверить, существует ли информация для каждой конкретной таблицы с неиндексированными кодами или идентификаторами.
Поскольку таблица «pre-staging» урезана, мы не включили автоматически сгенерированные идентификаторы.
В наших хранимых процедурах я ищу способы ускорения сканирования таблиц по этой конкретной таблице. Каков наилучший подход для этого? Индексы? Автоматически сгенерированные идентификаторы как кластерные индексы? Последний вариант сложен, потому что мы не можем установить отношения с нашими «промежуточными» данными, так как они усекаются для каждого дампа данных.