Пример 10-кратной классификации SVM в MATLAB - PullRequest
22 голосов
/ 18 июня 2010

Мне нужен как-то описательный пример, показывающий, как выполнить 10-кратную классификацию SVM для набора данных из двух классов.в документации MATLAB есть только один пример, но он не в 10 раз.Кто-нибудь может мне помочь?

1 Ответ

43 голосов
/ 18 июня 2010

Вот полный пример с использованием следующих функций из набора инструментов биоинформатики: SVMTRAIN , SVMCLASSIFY , CLASSPERF , CROSSVALIND .

load fisheriris                              %# load iris dataset
groups = ismember(species,'setosa');         %# create a two-class problem

%# number of cross-validation folds:
%# If you have 50 samples, divide them into 10 groups of 5 samples each,
%# then train with 9 groups (45 samples) and test with 1 group (5 samples).
%# This is repeated ten times, with each group used exactly once as a test set.
%# Finally the 10 results from the folds are averaged to produce a single 
%# performance estimation.
k=10;

cvFolds = crossvalind('Kfold', groups, k);   %# get indices of 10-fold CV
cp = classperf(groups);                      %# init performance tracker

for i = 1:k                                  %# for each fold
    testIdx = (cvFolds == i);                %# get indices of test instances
    trainIdx = ~testIdx;                     %# get indices training instances

    %# train an SVM model over training instances
    svmModel = svmtrain(meas(trainIdx,:), groups(trainIdx), ...
                 'Autoscale',true, 'Showplot',false, 'Method','QP', ...
                 'BoxConstraint',2e-1, 'Kernel_Function','rbf', 'RBF_Sigma',1);

    %# test using test instances
    pred = svmclassify(svmModel, meas(testIdx,:), 'Showplot',false);

    %# evaluate and update performance object
    cp = classperf(cp, pred, testIdx);
end

%# get accuracy
cp.CorrectRate

%# get confusion matrix
%# columns:actual, rows:predicted, last-row: unclassified instances
cp.CountingMatrix

с выводом:

ans =
      0.99333
ans =
   100     1
     0    49
     0     0

мы получили 99.33% точность только с одним экземпляром 'setosa', ошибочно классифицированным как 'non-setosa'


ОБНОВЛЕНИЕ : функции SVM перемещены в панель инструментов статистики в R2013a

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...