Неправильный атрибут в корневом узле дерева решений - PullRequest
0 голосов
/ 25 мая 2019

У меня есть два утверждения True / False относительно деревьев решений, в решении которых мне нужна помощь:

  1. При изучении дерева решений с бесшумными данными, начиная с неверного атрибута в корне, можно сделать невозможнымнайти дерево, которое точно соответствует данным.

Мои мысли: я прочитал в Машинном обучении Тома Митчелла:

В качестве крайнего примера рассмотрим атрибут Date, которыйимеет очень большое количество возможных значений (например, 4 марта 1979 г.).Если бы мы добавили этот атрибут к данным в таблице 3.2, он имел бы наибольший выигрыш в информации среди всех атрибутов.Это потому, что одна только Дата отлично предсказывает целевой атрибут по данным обучения.Таким образом, он будет выбран в качестве атрибута решения для корневого узла дерева и приведет к (довольно широкому) дереву глубины, которое прекрасно классифицирует обучающие данные.

Это заставляет меня задуматьсячто может быть проблемой выбрать неправильную начальную функцию для разделения данных на -> Таким образом, оператор TRUE .Это правильно?

Размер деревьев решений является решающим фактором для обучаемости по ID3 и его вариантам

Мои мысли: Если дерево решений обрезается, оно может не обобщаться должным образом из данных обучения, ипоэтому не учитесь.Другими словами, размер имеет значение.Так что этот тоже ИСТИНА .Это правильный взгляд на это?

Заранее спасибо !!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...