python контролируемое обучение с классификацией наборов данных - PullRequest
0 голосов
/ 20 июня 2020

Я новичок в глубоком обучении и в настоящее время изучаю определенный топи c. Я ищу машинное обучение для обнаружения аномалий в шаблоне временных рядов и их реализации в python.

Например, у меня есть запись различных частот процессора моего компьютера в течение определенного интервала времени. Я хотел бы реализовать алгоритм контролируемого обучения, который принимает временной ряд частоты процессора в качестве входных данных и решает, произошло ли что-нибудь «необычное» за это время (необычное использование процессора и т. Д. c).

EDIT:

Мои наборы данных выглядят следующим образом: каждые 10 секунд измеряется текущая частота процессора. Я не указал точное количество точек данных в наборе, следующее приведено только для иллюстрации. Но я ожидаю около 2500 точек данных на набор:

Dataset_1: {1.2, 1.2, 1.6, 1.3, 1.5, 1.7, 1.6, 1.4, 1.5} -> Метка: "хорошо"

Набор данных_2: {1.3, 1.2, 1.4, 1.3, 1.4, 1.5, 1.9, 2.1, 2.0} -> Метка: "хорошо"

Набор данных_n: {1.3, 1.2, 3.6, 3.5, 1.4, 1.5, 3.3 , 3.2, 1.2} -> Label: "bad"

Насколько я понимаю, контролируемый алгоритм машинного обучения состоит в том, что у меня есть обучающие наборы данных. Однако каждый учебник, который я нашел до сих пор, всегда помечает каждое значение в наборе данных. В моем случае это было бы невозможно, поскольку я мог сказать только свой алгоритм ML:

a) этот набор данных временных рядов нормальный

b) в этом наборе данных что-то не так

но я не смогу пометить каждое отдельное значение, то есть я не могу сказать:

1,2 -> хорошо

1,3 -> плохо

1.4 -> хорошо

Поскольку существует множество различных алгоритмов машинного обучения, новичку сложно определить, какой из них лучше использовать. Итак, мой вопрос:

Какой (python реализованный) алгоритм я мог бы использовать в качестве начала, который принимает метки для всех наборов данных и не ожидает, что каждое значение будет помечено.

Надеюсь этот вопрос имеет смысл, правки приветствуются не меньше вашего времени! спасибо!

1 Ответ

0 голосов
/ 21 июня 2020

Для этого приложения я бы сделал go с KNN (K - ближайшие соседи). У Tech with Tim есть отличный учебник по KNN, он хорошо объясняет и показывает реализацию. Надеюсь, это поможет

...