Я пытаюсь найти подходящий классификатор для моего приложения. Мне очень нравятся машины опорных векторов для этого, но я столкнулся с проблемой с моими входными данными.
Пользователь обучает классификатор, используя записанный звук реального мира. Есть только два класса - «Хороший» и «Плохой».
Моя проблема в том, что почти все данные об обучении будут «хорошими» - очень маловероятно, что во время выездной встречи «плохая» информациятренировочный заезд.
Существует ли алгоритм, который работает как SVM, но возвращает результат того, насколько хорошо новые данные помещаются в «хорошую» строку? Или в верхней и нижней «хорошей» гиперплоскости (это было бы идеально, так как я ожидал, что допуски будут разными в разных измерениях).
В качестве альтернативы, есть ли алгоритм, который я мог бы использовать для автоматической генерацииплохие точки для моих тренировочных данных?
У меня была идея, что для каждой точки выборки, для каждой непрерывной оси, я ...
- Получить значение точки навыбранная ось (v)
- Определите максимальное и минимальное значение для этой оси во всех точках, которые имеют одинаковые дискретные значения и имеют близкие непрерывные значения ('min' и 'max')
- Add«плохая» точка в v + (max - min) и v - (max - min), чтобы помочь SVM.
Это, вероятно, заставит SVM работать в более высоком измерении, но мне кажется, это должно сработать?