Я пытаюсь закодировать алгоритм ID3. И мне интересно, что когда я кодирую, я должен:
- взять все атрибуты и все значения атрибутов в наборе данных, чтобы создать дерево с обучающим набором. Это приведет к отсутствию ценности во время тренировки. Я думаю, что я позволю метке ветви, у которой отсутствует значение атрибута, быть самой частой меткой его родительского узла.
- или мне просто нужно взять значения атрибутов в обучающем наборе, чтобы создать дерево во время обучения. И когда я проверю свое дерево, если увижу какие-то неизвестные данные, я дам ему наиболее часто встречающийся ярлык из уже известной ветви.
Большое вам спасибо.