Я хотел бы классифицировать этот набор данных Credit Scoring , который состоит из 21 атрибута, некоторые из которых являются цифрами c, а другие - логическими.
набор данных выглядит примерно так this
Attribute 9: (qualitative)
Personal status and sex
A91 : male : divorced/separated
A92 : female : divorced/separated/married
A93 : male : single
A94 : male : married/widowed
A95 : female : single
Attribute 10: (qualitative)
Other debtors / guarantors
A101 : none
A102 : co-applicant
A103 : guarantor
Attribute 11: (numerical)
Present residence since
Attribute 12: (qualitative)
Property
A121 : real estate
A122 : if not A121 : building society savings agreement/ life insurance
A123 : if not A121/A122 : car or other, not in attribute 6
A124 : unknown / no property
Вывод должен быть логическим (хорошим / плохим), я хочу знать, имеют ли они хороший или плохой кредит на основе этих атрибутов, без вычисления какого-либо числового значения c для кредитного рейтинга .
Я использую Weka для этой задачи. Однако я не уверен, каковы лучшие / идеальные классификаторы для таких наборов данных.
Кто-нибудь здесь может направить меня в правильном направлении?