Я использую Weka для классификации набора данных. Файл данных .arrf выглядит следующим образом. Проблема, с которой я сталкиваюсь при классификации, состоит в том, что многие классификаторы, такие как NaiveBayes и т. Д., Не будут использовать строковый атрибут для его классификации. Эти два строковых атрибута являются важными функциями для классификации. Я попытался преобразовать строку в номинальный тип, используя фильтр, но он не преобразовал ее в номинальный. Как мне поступить с учетом имеющегося у меня набора данных?
@RELATION transaction
@ATTRIBUTE transactionType {'CC Credit',Trans,Exp,Dep,Check}
@ATTRIBUTE number numeric
@ATTRIBUTE posting {Yes,No}
@ATTRIBUTE String1 string
@ATTRIBUTE String2 string
@ATTRIBUTE amount real
@ATTRIBUTE class {1,2}
@DATA
'CC Credit',?,Yes,'XYZ Bank','ONLINE PYMT Aug',-1582100.38,1
Trans,?,Yes,?,'ACH DEBIT XYZ CREDIT CRD-EPAY',-59219.40,2
Exp,?,Yes,'First Nolastname','ACH DEBIT First Nolastname-RECEIVER',-176011.56,2