Проблема в классификации данных на основе нескольких наборов функций - PullRequest
0 голосов
/ 03 апреля 2019

Я пытаюсь классифицировать данные на основе некоторых предварительно определенных меток, получил 4 столбца, как показано ниже:

room_class                          room_cluster  room_inb   room_view

Standard single sea view            Standard      single     sea
Deluxe twin Single                  Deluxe        single     -
Suite Superior room ocean view      Suite           -        ocean
Superior Double twin                Superior      Double     -
Deluxe Double room sea view         Deluxe        Double     sea

Ранее я работал над моделью обучения, основанной на классификаторе Knn, только с одним изстолбец функции, как показано ниже:

room_class                          room_cluster 

Standard single sea view            Standard    
Deluxe twin Single                  Deluxe        
Suite Superior room ocean view      Suite           
Superior Double twin                Superior      
Deluxe Double room sea view         Deluxe      

, где я сначала добавляю строковые значения к числовым значениям, поэтому 'room_class' будет 'Y' set и 'room_cluster' будут иметь 'X' с той же структурой, а затем запустят над ними Knn. Однако теперь к основным данным добавлены еще две строки, которые яхочу использовать. Как мне объединить три строки, то есть room_cluster, room_inb, room_view в X , сохраняя при этом room_class как Y изатем тренируйте модель на них.

Пример: после обучения модель должна классифицировать входные данные в следующие выходные данные.

Входные данные : двухместный улучшенный люкс с океаномview

Ожидаемый результат :
room_cluster: Superior
room_inb: Double
room_view: Ocean

Edit : этот вопрос я упоминал для одного набора функций:
Точность классификации на основе одного набора функций

...