Мне нужно реализовать ниже поток данных. У меня есть одна тема Кафка, которая имеет 9 разделов. Я могу читать эту тему с 9 уровнями параллелизма. У меня также есть 3 узла кластера Flink. Каждый из узлов этого кластера имеет 24 слота задач.
Прежде всего, я хочу распространить свою кафку, как, у каждого сервера есть 3 раздела, как показано ниже. Заказ не имеет значения, я только преобразовываю сообщение кафки и отправляю его в БД.
Во-вторых, я хочу увеличить степень параллелизма при сохранении NoSQL DB. Если я увеличу свой параллелизм 48, так как отправка БД является операцией ввода-вывода, она не потребляет ЦП, я хочу быть уверенным: когда Flink восстановит баланс моего сообщения, мое сообщение останется на том же сервере.
Есть какой-нибудь совет для меня?