1) Максимальное количество одновременных запросов, которые он может координировать, не обязательно ограничение количества запросов, которые он выполняет.Эта координация включает в себя такие вещи, как ожидание реплики (определяется уровнем согласованности) для возврата данных.Это не активная работа, поэтому нет никаких причин ограничивать количество ядер.
2) Обратное давление в вашем приложении, когда больше, чем ваш координатор настроен для одновременной обработки, применяется в памяти вашего координатора.Затраты здесь - это куча давления и памяти, доступной системе, а также время ожидания в очереди, добавленное к вашей задержке.
По вашему другому вопросу , я думаю, вы, возможно, слишком сосредоточены наэтап NTR, когда проблема вероятна в вашей модели данных / запросах.Если увеличение этой очереди не помогло, вероятно, это не причина.Как правило, единственный сценарий, когда NTR в очереди - это проблема, когда вы отбрасываете МНОГИЕ крошечные запросы одновременно (обычно более одного клиента может сделать в качестве ограничения по умолчанию 1024 на хост по умолчанию).Это практически единственный сценарий, который помогает увеличить предел очереди для сглаживания пиков.Если это не помогает, то используйте прокси-гистограммы / tablehistograms / tablestats, чтобы сузить таблицу и запрос, вызывающий давление.Если это не очевидно, это может быть проблема, связанная с GC, или и то, и другое.