Я настраиваю базу данных, в которой есть почасовые таблицы.Каждая таблица создается в одной инструкции копирования.Цель таблиц - хранить индексированные сводные данные, хранящиеся в стандартных файлах, которые действительно хорошо сжимаются.Для записи в этих файлах хранятся данные интернет-потока.
Иногда нам нужно искать в течение нескольких месяцев файлы, ища конкретные адреса, и работа по файлам по одному занимает много времени, поэтому целью является создание индексакаждого часового файла, в котором перечислены IP-адреса за этот час.Для поиска мы последовательно просматриваем интересующий нас временной диапазон и каждый час выполняем быстрый поиск, чтобы выяснить, нужно ли нам распаковывать и искать соответствующий файл на диске.
Я использую Postgres, поскольку он поддерживает IPадреса изначально.Поэтому для каждого часа я создаю таблицу с именем, связанным с соответствующим файлом на диске (дата и время, сюрприз).Мне нужны индексы для адресов источника и назначения, но я должен создать эти индексы до или после загрузки данных с помощью оператора копирования.
Я предполагаю, что другой способ выразить это - быстрее ли выполнять индексацию, когдаданные загружаются или сразу после того, как все это сделано.
Как только таблица загружена, она, как правило, никогда не будет изменена, пока не будет удалена.