У меня есть два клиента (отдельные док-контейнеры), которые пишут в кластер Cassandra.
Первый - это запись данных в реальном времени, которые принимаются со скоростью, с которой кластер может справиться, хотя и с небольшим запасом.вместимость.Это считается высокоприоритетными данными, и мы не хотим отбрасывать их.Скорость проглатывания варьируется от минуты к минуте.Иногда данные резервируются в очереди, из которой клиент считывает данные, а в другое время клиент очищает очередь и (кратко) ожидает дополнительных данных.
Второй - это массовый дамп данных из онлайн-магазина.Мы хотим записать его в Cassandra настолько быстро, насколько это возможно, со скоростью, которая поглощает любую свободную емкость, существующую после записи данных в реальном времени, но не заставляя кластер начать выдавать тайм-ауты.
Использование DataStaxДрайвер Python и разделение двух клиентов (то есть они не должны знать или взаимодействовать друг с другом), как я могу ограничить запись со второго клиента так, чтобы она максимально увеличивала пропускную способность записи при условии, что она не влияет на пропускную способность записипервого клиента?