Я хочу создать классификационное дерево в Matlab, используя classregtree. Тем не менее, многие данные поступают из широких гистограмм Я заметил, что когда я добавляю больше гистограмм, дерево становится хуже. Можно ли сказать Matlab, что он должен сгруппировать определенные столбцы, чтобы не угрожать всем значениям гистограммы по отдельности, а оценивать их как один?
Изменить: чтобы прояснить это немного подробнее, я приведу пример из моего текущего проекта. У меня есть набор данных «A» и набор данных «B». B представляет гистограмму, а A представляет все виды данных. Когда я использую A в качестве обучающего набора для дерева и использую этот набор для проверки дерева, я получаю оценку 155/220 элементов, которые были правильными. Если я сделаю то же самое для B, я получу 97/220. Однако, если я добавлю B к A, я получу 145/220, что меньше, чем 155/220. Я думаю, это потому, что classregtree не знает, что все значения из B на самом деле представляют одну переменную.