Трудно понять атрибут targetCategory PMML - PullRequest
0 голосов
/ 11 июня 2011

Я пытаюсь составить документ PMML для машины опорных векторов, и я запутался в атрибуте targetCategory для тега SupportVectorMachine, указанного на dmg.org. Мой вопрос: как это должно работать, когда существует более двух классификаторов? Должен ли быть один targetCategory и дополнительные атрибуты alternateTargetCategory, где это необходимо?

Учитывая набор данных Iris, я предполагаю, что это будет примерно так:

<SupportVectorMachine targetCategory="Iris-setosa" alternateTargetCategory="Iris-versicolor" alternateTargetCategory="Iris-virginica">

1 Ответ

0 голосов
/ 13 июня 2011

Я оглянулся еще немного и нашел ответ на свой вопрос. Есть бесплатное приложение под названием KNIME, которое довольно просто в использовании и генерирует вывод PMML. Оказывается, что alternateTargetCategory используется только для двоичной классификации. Для набора данных Iris выходные данные для SupportVectorMachine следующие:

<SupportVectorMachine targetCategory="1">
  <SupportVectors numberOfAttributes="4" numberOfSupportVectors="3">
    <SupportVector vectorId="1_1_23"/>
    <SupportVector vectorId="1_1_41"/>
    <SupportVector vectorId="2_2_98"/>
  </SupportVectors>
  <Coefficients numberOfCoefficients="3" absoluteValue="-1.2257883098134195">
    <Coefficient value="0.0082595394670607"/>
    <Coefficient value="5.981904829451028E-4"/>
    <Coefficient value="0.008857729950005803"/>
  </Coefficients>
</SupportVectorMachine>
<SupportVectorMachine targetCategory="2">
  <SupportVectors numberOfAttributes="4" numberOfSupportVectors="16">
  ... etc.
...