Кассандра и потребление ресурсов с несколькими арендаторами - PullRequest
0 голосов
/ 26 мая 2020

Рассмотрим таблицу с клиентским UUID + дата для ключа раздела и набор других столбцов. Вторичных индексов нет. На одного клиента может быть максимум 1 миллион строк в день. Без удалений.

Предположим, что CQL в этой таблице ведет себя хорошо: нет «разрешить фильтрацию», а частые выборки используют первичный индекс для отбраковки совпадений только с несколькими строками.

Эта настройка - простая, чистая таблица и доступ - здесь приводит:

как клиент A может отрицательно повлиять на производительность B, если они находятся в разных разделах?

Что наиболее вероятно?

  • ограничена память, поскольку все клиенты используют одну и ту же табличную память для данного блока Cassandra?

  • Ввод-вывод привязан как клиентское чтение / запись к тому же каталогу или файлу, где A ждет на B

  • Ограничение ЦП

AFAIK, основная проблема мультитенасности здесь - это скачки чтения / записи для клиента A в разделе, который происходит с находиться на одном компьютере с клиентом B, который делает то же самое, например, ежедневно в 17:00 составляет отчет EOD. То есть два активных пользователя, выполняющих большие рабочие наборы R / W, примерно в одно и то же время, когда их GUID + сегмент даты оказывается на одном и том же поле. предполагает, что только патологические случаи являются проблемами.

Если A

...