Представьте себе, что вы собираете все оценки учеников старших классов в мире каждый месяц в одну таблицу, и в записи каждого учащегося вам необходимо включить итоговые средние по предмету по классу, городу и стране учащегося. Это можно сделать в пост-процессе, но ваш начальник говорит, что это нужно делать во время сбора данных.
Ограничение: строки записываются в плоский файл, а затем массово вставляются в новую таблицу.
Какой была бы хорошая стратегия или шаблон проектирования, чтобы придерживаться нескольких сотен тысяч средних значений, пока таблица не будет создана, не добавляя чрезмерных затрат памяти / обработки на JVM или RDBMS? Любые идеи будут полезны.
Примечание. Поскольку таблица используется только для чтения, мы добавляем в нее кластерный индекс по завершении.