Я работаю над потоковым приложением, входной поток - это серия событий. Для каждого события мне нужно отфильтровать действительных подписчиков из реляционной базы данных.
eventId => (eventId, [subscriberIds])
Предположим, что таблица подписки ограничена (или неограничена, если это удобно) и имеет миллионы строк, есть ли способ сделать эту фильтрацию эффективной?
Предположим, я использую Flink, но я также открыт для решений Spark или Storm.