Как выбрать неконтролируемую модель обнаружения сбоев для потоковой передачи данных в реальном времени? - PullRequest
0 голосов
/ 10 мая 2019

У меня есть последовательность журналов с метками времени в формате json, которые должны быть классифицированы как успешные и неудачные (класс ошибок с подходящей аргументацией, например, почему происходит сбой). Здесь у журналов нет меток, поэтому очевидно, что следует использовать неконтролируемую модель. Классификация должна быть сосредоточена на том, чтобы связать два или более журналов, чтобы найти сбой, поскольку случай сбоя может быть обнаружен только путем анализа группы экземпляров.

Я уже пробовал кластеризацию K-средних, где можно получить выходные данные, но не могу понять, верны они или нет, так как в нем нет меток для расчета точности, и эта кластеризация не предполагает корреляции в набор данных (т. е. анализ двух или более журналов для поиска ошибки)

Фактический вывод - двоичные файлы (0 или 1), но я ожидаю, что вывод будет значимой причиной того, почему он не прошел

...