Matlab ClassificationTree группы данных - PullRequest
0 голосов
/ 02 января 2012

Я хочу создать классификационное дерево в Matlab, используя classregtree. Тем не менее, многие данные поступают из широких гистограмм Я заметил, что когда я добавляю больше гистограмм, дерево становится хуже. Можно ли сказать Matlab, что он должен сгруппировать определенные столбцы, чтобы не угрожать всем значениям гистограммы по отдельности, а оценивать их как один?

Изменить: чтобы прояснить это немного подробнее, я приведу пример из моего текущего проекта. У меня есть набор данных «A» и набор данных «B». B представляет гистограмму, а A представляет все виды данных. Когда я использую A в качестве обучающего набора для дерева и использую этот набор для проверки дерева, я получаю оценку 155/220 элементов, которые были правильными. Если я сделаю то же самое для B, я получу 97/220. Однако, если я добавлю B к A, я получу 145/220, что меньше, чем 155/220. Я думаю, это потому, что classregtree не знает, что все значения из B на самом деле представляют одну переменную.

1 Ответ

0 голосов
/ 30 июня 2012

Я давно отправил этот вопрос, но нашел ответ.Невозможно сгруппировать определенные элементы в дереве регрессии / классификации, однако есть решение, которое дает аналогичный результат.

Matlab также может сказать вам, насколько достоверным является ответ дерева, используяtest и nodeerr функции.Используя эту информацию, можно комбинировать несколько деревьев.Таким образом, вместо того, чтобы поместить все данные в одно дерево, вы можете создать несколько деревьев.Теперь вы можете выполнять эти деревья независимо и получать несколько, возможно, разных результатов.Используя значения ошибок каждого результата, вы можете рассчитать, какой ответ наиболее вероятен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...