Когда люди описывают набор данных Large , они часто имеют в виду тот, где весь набор данных не может быть сохранен в памяти.Это создает проблемы относительно того, какие данные загружать и когда загружать и выгружать их.
Одним из подходов является использование файла последовательных данных и обработка от начала до конца.Это эффективно, когда характер обработки последовательный, но не работает хорошо, когда при обработке необходимо объединить данные из различных частей набора данных.
Другой подход - это какой-то индексированный файл, извлекающий необходимые данные.биты данных по мере необходимости.
Специализация этого - использование файлов с отображением в памяти, где вы позволяете менеджеру памяти обрабатывать загрузку и кэширование данных.
СУБД может значительноупростить доступ к данным, но добавляет некоторые системные издержки.