Я использую Apache Beam Java SDK для обработки событий и записи их в базу данных Clickhouse. К счастью, есть готовый к использованию ClickhouseIO .
ClickhouseIO накапливает элементы и вставляет их в пакетном режиме, но из-за параллельного характера конвейера это все равно приводит к большому количеству вставок в секунду в моем дело. В Clickhouse я часто получаю «DB :: Exception: слишком много частей» или «DB :: Exception: слишком много одновременных запросов».
Документация Clickhouse рекомендует делать 1 вставку в секунду , Есть ли способ, которым я могу гарантировать это с ClickhouseIO? Может быть, какая-то группировка КВ до ClickhouseIO.Write или что-то еще?