Некоторые API, такие как GET /indexes
, регулируются на основе простых ограничений скорости. Однако запросы и запросы на индексирование не работают таким образом. В случае этих API регулирование происходит динамически в зависимости от доступности ресурсов. Если внутренние очереди системы начнут заполняться, запросы начнут отказывать с 503 (служба недоступна). Если в течение отдельного периода времени произойдет достаточное количество таких отказов (рассчитывается как среднее по скользящему окну), служба будет регулировать запросы, чтобы сбросить давление и позволить системе восстановиться.
Причина, по которой происходит регулированиеВместо того, чтобы основываться на статических ограничениях скорости, большинство ценовых уровней Azure Cognitive Search (кроме бесплатных) предоставляют вам выделенную емкость. Статические ограничения скорости могут искусственно ограничивать использование вами собственной емкости, поэтому вместо этого динамическое регулирование применяет противодавление в качестве способа обеспечения надежности службы при ее перегрузке.
Дополнительные сведения о тестировании и настройке производительности Azure. Когнитивный поиск, см. эту статью .