Мне было интересно, существует ли структура данных, оптимизированная для подсчета частот по отношению к данным, которые хранятся в табличном формате базы данных.например, данные поступают в формате (запятая) ниже.
col1, col2, col3
x, a, green
x, b, blue
...
y, c, green
Теперь я просто хочу посчитать частоту col1 = x или col1 = x и col2 = зеленый.я хранил данные в таблице базы данных, но в моем профилировании и из эмпирических наблюдений подключение к базе данных является узким местом.я тоже пытался использовать базы данных в памяти, и это работает довольно хорошо;единственная проблема - требования к памяти и причудливые вызовы init / destroy.
Кроме того, я работаю в основном с Java, но имею опыт работы с .net, и мне было интересно, есть ли API для работы с «табличными» даннымиlinq способ с использованием Java.
любая помощь приветствуется.