Я использую новую экспериментальную очередь задач для java appengine и пытаюсь создать задачи, которые собирают статистику в моем хранилище данных. Я пытаюсь подсчитать количество уникальных значений во всех правах (определенного типа) в моем хранилище данных. Конкретнее, скажем, сущность типа X имеет поле A. Я хочу посчитать ЧИСЛО уникальных значений A в моем хранилище данных.
Мой текущий подход заключается в создании задачи, которая запрашивает первые 10 сущностей типа X, создает хеш-таблицу для хранения уникальных значений A, а затем передает эту хеш-таблицу следующей задаче в качестве полезной нагрузки. Это следующее задание будет считать следующие 10 сущностей и так далее, и так далее, пока я не пройдусь по всем сущностям. Во время выполнения последней задачи я посчитаю количество ключей в моей хеш-таблице (которая передавалась от задачи к задаче все время), чтобы найти общее количество уникальных значений A.
Это работает для небольшого числа объектов в моем хранилище данных. Но я боюсь, что эта хеш-таблица станет слишком большой, когда у меня будет много уникальных значений. Каков максимально допустимый размер для полезной нагрузки задачи appengine ?????
Можете ли вы предложить какие-либо альтернативные подходы?
Спасибо.