Question

Постановка проблемы

Объекты прибывают для обработки и проходят через ряд шагов, которые работают с этими объектами и, возможно, с другими, связанными объектами и генерируют некоторые результаты;
Некоторые объекты должны обрабатываться в режиме реального времени без доступа к базе данных;
В настоящее время реализация просто просматривает сущности в базе данных без кэширования.

Время оптимизации: -)

Возможные подходы

Простой кеш

Простой кэш в памяти имеет 2 недостатка:

может переполниться, поскольку речь идет о большом количестве объектов;
это не гарантирует, что требуемые сущности найдены в кеше, и у него нет никакого способа узнать о доступности или попросить «предварительно загрузить» себя.

Так что это не пойдет.

Анализ сущностей + предварительная загрузка

Я рассматриваю возможность создания своего рода анализатора, чтобы выяснить, какие данные необходимо извлечь для данного объекта, даже в больших формах, и выполнить запрос к кешам для загрузки необходимых данных вне диапазона.

Шаги будут:

Сущность прибывает. Если требуется обработка в памяти, отправьте запрос загрузки кэша;
Объект помещается в очередь ожидания кэша, пока не будет получен ответ загруженного кэша. Это может быть немедленным, если данные доступны;
Объект отправляется на обработку и использует загруженные данные;
Кэши очищены. У этого есть потенциал для очистки политики, но я не беспокоюсь о тех в настоящее время.

Вопросы

Что вы думаете об этом подходе? Я скучаю по некоторым известным шаблонам доступа к данным, которые могут быть применены в этом случае?

Обновление 1 : забыл упомянуть, что вся обработка однопоточная, и это значительно ограничивает возможности.

matt b · Answer 1 · 03 июня 2009

Вы сказали:

Простой кэш в памяти имеет 2 недостатка:

может переполниться, так как речь идет о большом количестве объектов

это не гарантирует, что требуемые сущности найдены в кеше, и не может быть запрошено о доступности или предложено "предварительно загрузить" себя.

Возможно, я полностью неправильно понимаю ваш вопрос и потребности, но это звучит неправильно на нескольких уровнях:

Многие решения для кэширования позволяют вам определить максимальное количество элементов, которое вы можете сохранить в кэше. После достижения максимального размера элементы могут быть удалены по принципу «первым пришел - первым обслужен» или на основе наименее недавно использованного.
Кеш не должен "гарантировать, что требуемые сущности найдены в кеше"; это не цель кэша.
API для большинства решений для кэширования позволяет вам проверить, присутствует ли ключ в кэше (фактически, если вы создали собственное решение с использованием Map, вы все равно могли бы сделать это ...).
Ehcache имеет самонаселенных кешей , которые можно использовать для предварительного заполнения кеша перед тем, как начинать извлекать элементы ( другая ссылка здесь ).

Andomar · Answer 2 · 03 июня 2009

Обычно вы пытаетесь кешировать запросы к базе данных. К тому времени, когда вы приступите к использованию кэша, состояние базы данных может измениться. Это рецепт для несоответствия данных.

В качестве альтернативы проверьте, можете ли вы оптимизировать базу данных. Очень возможно, чтобы база данных отвечала на запросы в течение

В качестве другой альтернативы рассмотрите следующее: общий объем работы не уменьшается при предварительной выборке данных. Сущность должна ждать предварительной выборки, вне зависимости от того, находится она в очереди или нет. Так как работа должна быть выполнена в любом случае, вы могли бы также сделать это в рабочем процессе очереди? Подумайте об увеличении количества рабочих процессов, чтобы вы могли обрабатывать больше очередей одновременно.

РЕДАКТИРОВАТЬ: Как ваш комментарий говорит, что вы связаны с одним рабочим потоком:

Может быть, разделить обработку на два этапа? Первый процесс извлекает данные базы данных и сохраняет обогащенную сущность в новой очереди. Второй процесс читает из новой очереди и выполняет работу с другими источниками данных в памяти
Защита других объектов в памяти глобальным мьютексом. Это означает, что многие рабочие потоки могут общаться с базой данных, в то время как только один может обращаться к другим объектам в памяти.

Гарантированные попадания в кеш при получении данных

Постановка проблемы

Возможные подходы

Простой кеш

Анализ сущностей + предварительная загрузка

Вопросы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Гарантированные попадания в кеш при получении данных

Постановка проблемы

Возможные подходы

Простой кеш

Анализ сущностей + предварительная загрузка

Вопросы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов