Одноклассные опорные векторные машины - PullRequest
3 голосов
/ 29 июля 2011

Итак, я хочу убедиться, что у меня есть это право. Во-первых, я учусь на старшекурсника по компьютерной инженерии и обладаю гораздо большим опытом в области аппаратного обеспечения / ЭЭ, чем программного обеспечения. Этим летом я обнаружил, что использую алгоритм кластеризации, который использует SVM одного класса. Является ли SVM просто математической моделью, используемой для классификации / разделения входных данных? Хорошо ли работает SVM для наборов данных с одним атрибутом / переменной? Я полагаю, что нет, возможно, потому, что классификация с одним атрибутом практически является стереотипом. Я предполагаю, что SVM лучше работает с наборами данных, которые имеют несколько атрибутов / переменных, чтобы внести свой вклад в классификацию. Заранее спасибо!

1 Ответ

4 голосов
/ 29 июля 2011

SVM пытается построить гиперплоскость , разделяющую 2 класса (AFAIK, в одноклассном SVM есть один класс для "нормальных" и один класс для "ненормальных" экземпляров). Имея только один атрибут, вы получаете одномерное пространство, то есть line . Таким образом, гиперплоскость здесь представляет собой точку на линии. Если экземпляры 2 классов (точек на этой линии) могут быть разделены этой точкой гиперплоскости (то есть они являются линейно разделимыми), тогда да, SVM может использоваться. В противном случае нет.

Обратите внимание, что с несколькими атрибутами SVM все еще можно использовать для классификации даже линейно неразделимых экземпляров. На следующем изображении 2 класса в двухмерном пространстве (2 атрибута - X и Y), один отмечен синими точками, а другой зелеными.

enter image description here

Вы не можете нарисовать линию, которая может их разделить. Тем не менее, так называемый трюк ядра может использоваться для создания гораздо большего количества атрибутов путем объединения существующих. С большим количеством атрибутов вы можете получить пространство большего размера, где все экземпляры могут быть разделены ( video ). К сожалению, один атрибут не может быть объединен с самим собой, поэтому для одномерного пространства уловка ядра не применима.

Итак, ответ на ваш вопрос: SVM может использоваться на наборах только с одним атрибутом, если и только если экземпляры 2 классов линейно разделимы сами по себе .

...