Я хочу использовать выученную модель - PullRequest
0 голосов

У меня уже есть дерево решений, но теперь я хочу использовать это дерево решений, чтобы предсказать, что новые данные не известный класс

У меня есть:

Tid :  1 2 3 4 5 6 7 8 9 10
Refund : Yes No No Yes No No Yes No No No
MaritalStatus : Single Maried Single Maried Divorced 
                           Maried Divorced Single Maried Single
TexableIncome : 125K 100K 70K 120K 95K 60K 220K 85K 
                               75K 90K
Cheat (this attribute is class) : No No No No Yes No No Yes 
                                                      No Yes

После того, как я использую эти данные выше для дерева решений поезда, я получаю дерево, но после этого у меня есть данные, которые я не знаю, класс. Я хочу использовать дерево, которое я получил, чтобы предсказать класс

Tid : 11 12 13 14 15
Attrib1 : No Yes Yes No No 
Attrib2 : Small Medium Large Small Large 
Attrib3 : 55k 80k 110k 95k 67k
Class :    ?    ?    ?   ?  ?  (I want to predict this by my first tree)

1 Ответ

0 голосов
/ 27 марта 2019

Модель дерева решений обучается по всем доступным атрибутам обучающего набора. Все решения, ведущие к предсказанию метки (класса), основаны на этих конкретных атрибутах. Таким образом, ваша предварительно обученная модель может применяться только к наборам примеров, которые, по крайней мере, содержат все атрибуты обучающего набора (имейте в виду, что атрибуты с особой ролью, такие как «id», игнорируются алгоритмом обучения).

В вашем примере модель использует Refund, MaritalStatus и TexableIncome (правописание?), Но второй набор данных, для которого вы хотите предсказать метку, имеет атрибуты Attrib1, Attrib2 и Attrib3. Даже простое переименование не сработает, так как тип возможных значений отличается от MaritalStatus: Divorced, Single, Maried (опять же, написание?) И Attrib2: Small, Medium, Large.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...