Алгоритм обучения дерева решений - PullRequest
3 голосов
/ 07 ноября 2010

Я хочу предварить это, сказав, что это домашнее задание.

Мне дан набор из двоичных входных переменных Q, которые будут использоваться для классификации выходных данных Y, которые также являются двоичными.

Первая часть вопроса звучит так: самое большее, сколько примеров мне нужно, чтобы перечислить все возможные комбинации Q?В настоящее время я думаю, что, поскольку он запрашивает самое большее, мне понадобится Q, поскольку возможно, что все значения до Q-1 одинаковы для экземпляра 1, а элемент в Q равен 0.

Вторая частьвопрос заключается в следующем: самое большее, сколько листовых узлов дерево может дать в качестве примера Z?
Мой текущий ответ таков, что самое большее в дереве будет 2 листовых узла, один из которых представляет истину, а другой - ложь, поскольку имеет дело с двоичнымвходы и двоичные выходы.

Это правильный способ изучения этой проблемы, или я обобщаю свои ответы слишком глубоко?

Редактировать

Изучив ответ Кэмерон, я сейчас переверну свой первый ответв 2 ^ Q и опираясь на его пример Q = 3, я бы получил 2 ^ 3 или 8 (2 * 2 * 2).Пожалуйста, исправьте, если это неправильное мышление.

Редактировать # 2

Вторая часть вопроса выглядит так, как будто она должна быть (2 ^ Q) * Z, или привести пример: (2 ^ 3) * 3) или8 * 3 = 24 листовых узла.Напомним, что если у меня есть 3 бинарных входа, я бы сначала взял 2 ^ 3 и получил 8, а сейчас я хочу просмотреть 3 примера.Поэтому я должен получить 8 * 3 или 24.

Edit # 3

Оглядываясь назад, кажется, что независимо от того, сколько примеров я использую, число листовых узлов никогда не должно увеличиваться, так как этона основе дерева.

1 Ответ

1 голос
/ 07 ноября 2010

Я бы посоветовал вам подойти к решению проблемы вручную, выполнив небольшие примеры.

Для первой части выберите небольшое значение для Q, скажем, 3, и запишите все возможные комбинации Q. Тогда вы можете выяснить, сколько примеров вам нужно. Увеличьте Q и сделайте это снова.

Для второй части вашего вопроса выберите маленький Z и запустите алгоритм дерева решений вручную. Посмотри, сколько у тебя листьев. Затем выберите другой Z и посмотрите, если / как он изменится. Попробуйте создать разные примеры (с одним и тем же Z) и посмотрите, можете ли вы изменить количество листьев.

...