У меня есть требование, в котором мне нужно прочитать сообщение из темы kafka, выполнить поиск в наборе данных, а затем отправить сообщение в зависимости от результата поиска данных.Ниже приведен пример, чтобы сделать это немного понятнее.
В теме Kafka получено сообщение xml с полем messageID, содержащим значение 2345
Мы выполняем поиск и подтверждаем, что сообщение с этим идентификатором не имеетбыл отправлен раньше.Если это возвращается false, мы отправляем сообщение и затем добавляем этот messageID к поисковым данным.Если этот messageID уже находится в данных поиска, мы не отправляем его.
В настоящее время это достигается с помощью таблицы hbase для хранения данных поиска.Однако мы можем получать много миллионов сообщений в день, и я обеспокоен тем, что производительность компонента со временем будет ухудшаться.
Есть ли альтернативное, более оптимизированное решение для использования hbase для этих данных поиска, например, для сохранения этих данных в памяти в СДР?Я попытался сделать это, но у меня возникли некоторые трудности, так как контексты искры явно не сериализуемы, поэтому я не мог добавить к существующему набору данных lookuo
Любые предложения очень ценятся!
Большое спасибо
Dan