Когда использовать «/ весь» или «последний» API в Azure Anomaly Detector? - PullRequest
1 голос
/ 19 апреля 2019

Изучив документы API-интерфейсов Anomaly Detector, я обнаружил, что существует два API (или «режима»): / last и / whole.Док говорит, что они потоковые или пакетные режимы.Тем не менее, я не думаю, что сообщение очень четкое, и эти два API / режима, кажется, имеют действительно схожую функциональность.У меня есть некоторые данные IoT от датчиков на заводском этаже;Я мог бы предварительно обработать данные, чтобы убедиться, что они соответствуют требованиям API;Я мог бы кодировать с C # в моем приложении.Может ли кто-нибудь помочь разобраться, как выбрать лучший API для моего сценария?

Я пробовал оба API в записных книжках Azure

1 Ответ

1 голос
/ 19 апреля 2019

Спасибо за использование детектора аномалий.

Конечная точка обнаружения партии API детектора аномалий позволяет обнаруживать аномалии по всем данным временного ряда.В этом режиме обнаружения для каждой точки в наборе данных создается отдельная статистическая модель.Если ваш временной ряд имеет следующие характеристики, мы рекомендуем использовать обнаружение партии для предварительного просмотра данных в одном вызове API.

  1. Сезонный временной ряд со случайными аномалиями.
  2. Плоская тенденциявременные ряды, со случайными всплесками / провалами.

Мы не рекомендуем использовать пакетное обнаружение аномалий для мониторинга данных в режиме реального времени или использовать его для данных временных рядов, которые не имеют вышеуказанных характеристик.

  1. При обнаружении партии создается и применяется только одна модель, обнаружение для каждой точки выполняется в контексте целого ряда.

    Если данные временного ряда изменяются вверх и внизбез сезонности модель может пропустить некоторые моменты изменений (провалы и скачки в данных).Точно так же некоторые точки изменения, которые являются менее значимыми, чем те, которые позже в наборе данных, могут не считаться достаточно значительными для включения в модель.

  2. Обнаружение партии выполняется медленнее, чем обнаружениесостояние аномалии самой последней точки при выполнении мониторинга данных в реальном времени из-за количества анализируемых точек.

Для мониторинга данных в режиме реального времени мы рекомендуем определять состояние аномалии только для вашей последней точки данных.Постоянно применяя новейшее обнаружение точек, мониторинг потоковых данных может выполняться более эффективно и точно.

В приведенном ниже примере описывается влияние, которое эти режимы обнаружения могут оказать на производительность.На первом рисунке показан результат непрерывного обнаружения самой последней точки состояния аномалии вдоль 28 ранее замеченных точек данных.Красные точки - аномалии.

Изображение, показывающее обнаружение аномалий с использованием самой последней точки

Ниже приведен тот же набор данных, в котором используется обнаружение аномалий партии.Модель, созданная для операции, проигнорировала несколько аномалий, отмеченных прямоугольниками.

Изображение, показывающее обнаружение аномалий с использованием пакетного метода

Еще раз спасибо, мы добавим информациюв публичную документацию службы AD.

...