Я пытаюсь классифицировать данные на основе некоторых предварительно определенных меток, получил 4 столбца, как показано ниже:
room_class room_cluster room_inb room_view
Standard single sea view Standard single sea
Deluxe twin Single Deluxe single -
Suite Superior room ocean view Suite - ocean
Superior Double twin Superior Double -
Deluxe Double room sea view Deluxe Double sea
Ранее я работал над моделью обучения, основанной на классификаторе Knn, только с одним изстолбец функции, как показано ниже:
room_class room_cluster
Standard single sea view Standard
Deluxe twin Single Deluxe
Suite Superior room ocean view Suite
Superior Double twin Superior
Deluxe Double room sea view Deluxe
, где я сначала добавляю строковые значения к числовым значениям, поэтому 'room_class' будет 'Y' set и 'room_cluster' будут иметь 'X' с той же структурой, а затем запустят над ними Knn. Однако теперь к основным данным добавлены еще две строки, которые яхочу использовать. Как мне объединить три строки, то есть room_cluster, room_inb, room_view в X , сохраняя при этом room_class как Y изатем тренируйте модель на них.
Пример: после обучения модель должна классифицировать входные данные в следующие выходные данные.
Входные данные : двухместный улучшенный люкс с океаномview
Ожидаемый результат :
room_cluster: Superior
room_inb: Double
room_view: Ocean
Edit : этот вопрос я упоминал для одного набора функций:
Точность классификации на основе одного набора функций