API данных 2.0 - кластер получает ответ - TEMPORARILY_UNAVAILABLE - PullRequest
0 голосов
/ 01 ноября 2019

У меня есть спарк-кластер в Azure Databricks, и я использую C # API для запуска кластера и получения статуса кластера. До 24 октября это работало нормально в течение нескольких месяцев. С тех пор я начал получать сообщения об ошибках следующего формата

Ответ кластера: {"error_code": "TEMPORARILY_UNAVAILABLE", "message": "Нет веб-приложенийдоступны для обработки вашего запроса. Повторите попытку позже. "}

Мой кластер находится в восточной части США.

Эта ошибка периодически появляется при попытке доступа к состоянию кластера. или начать это. Я прилагаю образец ошибок, которые я получил за последние несколько дней.

Error message on ClustersListAsync

Error message Cluster Get Response Может кто-нибудь пожалуйстаПосоветуйте, как решить эту проблему?

1 Ответ

2 голосов
/ 01 ноября 2019

Эта проблема возникает из-за сбоя в работе Azure.

Сводка воздействия: Между примерно 11:00 и 14:40 UTC 25 октября 2019 года, часть клиентов, использующих AzureПри входе в рабочую область Databricks блоки данных могли получать уведомления об ошибках «Нет веб-приложения». Связанные вызовы API, возможно, также не вернули ответ. Кроме того, очень ограниченное число клиентов, использующих Data Factory v2, могли получать уведомления о сбоях для заданий потока данных.

Предварительная основная причина: Инженеры определили, что внутренняя база данных использовалась для обработки запросов доступа к рабочему пространству. стало нездоровым, в результате чего запросы не сработали. Поскольку эта база данных поддерживает плоскость управления для регионов Восток США, Восток США 2, Централ США и Север Центрально-Американский, влияние могли оказать только клиенты в этих регионах. Кроме того, небольшое количество клиентов Data Factory v2 в этих регионах могли бы столкнуться с последующим воздействием этой проблемы.

Смягчение: Инженеры повторно развернули уязвимую базу данных бэкэнда, чтобы смягчить проблему.

Следующие шаги: Инженеры продолжат расследование, чтобы установить основную причину и предотвратить возникновение в будущем. Получайте информацию о проблемах службы Azure, создавая настраиваемые оповещения о работоспособности службы: https://aka.ms/ash-videos для видеоруководств и https://aka.ms/ash-alerts для ознакомительной документации.

Для получения дополнительной информации см. "История состояния службы Azure".

Обновление: отключение OCT 31

Сводка воздействия: Между 00:00 UTC и 00: 45 31 октября 2019 года, инженеры вступили в период обслуживания, чтобы смягчить регресс в последнем обновлении 3.5, которое могло потенциально повлиять на ваши службы ODBC / JDBC. Инженеры выполнили исправление во время периода обслуживания, который занял приблизительно 10 минут. Блоки данных На создание кластера, возможно, оказали кратковременные изменения во время применения исправления, а также связанные вызовы API (создание, обновление, удаление, автоматическое масштабирование). Доступ к пользовательскому интерфейсу также может быть подвергнут кратковременному воздействию. Запущенные задания или ранее созданные кластеры не должны были подвергаться воздействию.

Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...