Я новичок в глубоком обучении и в настоящее время изучаю определенный топи c. Я ищу машинное обучение для обнаружения аномалий в шаблоне временных рядов и их реализации в python.
Например, у меня есть запись различных частот процессора моего компьютера в течение определенного интервала времени. Я хотел бы реализовать алгоритм контролируемого обучения, который принимает временной ряд частоты процессора в качестве входных данных и решает, произошло ли что-нибудь «необычное» за это время (необычное использование процессора и т. Д. c).
EDIT:
Мои наборы данных выглядят следующим образом: каждые 10 секунд измеряется текущая частота процессора. Я не указал точное количество точек данных в наборе, следующее приведено только для иллюстрации. Но я ожидаю около 2500 точек данных на набор:
Dataset_1: {1.2, 1.2, 1.6, 1.3, 1.5, 1.7, 1.6, 1.4, 1.5} -> Метка: "хорошо"
Набор данных_2: {1.3, 1.2, 1.4, 1.3, 1.4, 1.5, 1.9, 2.1, 2.0} -> Метка: "хорошо"
Набор данных_n: {1.3, 1.2, 3.6, 3.5, 1.4, 1.5, 3.3 , 3.2, 1.2} -> Label: "bad"
Насколько я понимаю, контролируемый алгоритм машинного обучения состоит в том, что у меня есть обучающие наборы данных. Однако каждый учебник, который я нашел до сих пор, всегда помечает каждое значение в наборе данных. В моем случае это было бы невозможно, поскольку я мог сказать только свой алгоритм ML:
a) этот набор данных временных рядов нормальный
b) в этом наборе данных что-то не так
но я не смогу пометить каждое отдельное значение, то есть я не могу сказать:
1,2 -> хорошо
1,3 -> плохо
1.4 -> хорошо
Поскольку существует множество различных алгоритмов машинного обучения, новичку сложно определить, какой из них лучше использовать. Итак, мой вопрос:
Какой (python реализованный) алгоритм я мог бы использовать в качестве начала, который принимает метки для всех наборов данных и не ожидает, что каждое значение будет помечено.
Надеюсь этот вопрос имеет смысл, правки приветствуются не меньше вашего времени! спасибо!