Перезапустите Elastic ML Job - PullRequest
0 голосов
/ 10 июля 2019

Я использую решение для эластичного облака и играю с ML в Кибане.
Я загружаю кучу журналов в эластичный индекс, а затем создаю задание ML для запуска через индекс и поиска аномалий.
Работа отлично работает, и я получаю свои аномалии.
Проблема в том, что когда я загружаю новые журналы на работу, например, через 2 дня после предыдущей загрузки, я не получаю новые аномалии.

Если я снова загружаю все журналы (старые с новыми данными за последние 2 дня), затем воссоздаю задание ML и запускаю его снова, я получаю новые аномалии (старые и аномалии за последние 2 дня, которые не были представлены во время первый запуск).

Мой текущий поток выглядит так:

  1. Загрузка логов в индекс эластичности
  2. Создание задания ML с подачей данных из этого индекса
  3. Получить результаты
  4. Получить новые журналы (или подождать несколько дней)
  5. Изменить состояние задания ML на открыть
  6. Загрузка журналов в ML Job
  7. Подождите несколько минут (так как я добавляю примерно 1000 новых журналов, я жду 2 минуты)
  8. Заподлицо
  9. Подождите несколько минут
  10. Закрыть работу
  11. Получить результаты работы

Но проблема в том, что если я посмотрю на вкладку задания 1046 в Кибане, то у меня появится последняя запись в ML Job с правильной (самой последней) датой.
Но я не получаю новых аномалий.
Кроме того, в разделе Counts для этой работы ML я вижу:

число обработанных полей: 649 638

и

input_field_count: 651 068

Если я посещу Single metric viewer для этой работы, я вижу, что новые записи не были обработаны.
Итак, я предполагаю, что ML просто не перезапускает работу и не анализирует новые данные.

Я потратил много времени на изучение эластичной документации ML и не могу найти способ возобновить работу.
Итак, вопрос в том, как перезапустить работу ML?

...