Kafka - это брокер сообщений для обработки и буферизации потока данных, это не база данных . Так что произвольный доступ к данным невозможен . Стратегия ограниченного чтения заключается в чтении данных из определенного раздела. Самое большее, вы можете настроить своего производителя на распространение данных в соответствии с вашими потребностями в чтении. Например, при получении данных от датчика кто-то может создать тему с 24 разделами и опубликовать данные датчика в соответствии с отметкой времени выборки. Теперь у вас есть данные каждый час в определенном разделе.
Однако , эта стратегия не вписывается в философию Кафки! При использовании данных из Kafka вы можете достичь наибольшего параллелизма данных в зависимости от количества разделов, один потребитель для каждого раздела . Но когда вы публикуете каждое входящее сообщение в разделы в соответствии с отметкой времени выборки, только раздел за раз буферизует данные, и ваше приложение может использовать данные с параллелизмом один!