Алгоритмы классификатора, которые можно обучить только с «хорошими» данными - PullRequest
0 голосов
/ 04 октября 2019

Я пытаюсь найти подходящий классификатор для моего приложения. Мне очень нравятся машины опорных векторов для этого, но я столкнулся с проблемой с моими входными данными.

Пользователь обучает классификатор, используя записанный звук реального мира. Есть только два класса - «Хороший» и «Плохой».

Моя проблема в том, что почти все данные об обучении будут «хорошими» - очень маловероятно, что во время выездной встречи «плохая» информациятренировочный заезд.

Существует ли алгоритм, который работает как SVM, но возвращает результат того, насколько хорошо новые данные помещаются в «хорошую» строку? Или в верхней и нижней «хорошей» гиперплоскости (это было бы идеально, так как я ожидал, что допуски будут разными в разных измерениях).

В качестве альтернативы, есть ли алгоритм, который я мог бы использовать для автоматической генерацииплохие точки для моих тренировочных данных?

У меня была идея, что для каждой точки выборки, для каждой непрерывной оси, я ...

  • Получить значение точки навыбранная ось (v)
  • Определите максимальное и минимальное значение для этой оси во всех точках, которые имеют одинаковые дискретные значения и имеют близкие непрерывные значения ('min' и 'max')
  • Add«плохая» точка в v + (max - min) и v - (max - min), чтобы помочь SVM.

Это, вероятно, заставит SVM работать в более высоком измерении, но мне кажется, это должно сработать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...