Роль обучающих и тестовых наборов в построении дерева решений и его использовании для классификации - PullRequest
3 голосов
/ 17 февраля 2011

Я работаю weka уже пару месяцев. В настоящее время я работаю над курсом машинного обучения здесь, в Университетском колледже Эстфолл. Мне нужен лучший способ построить дерево решений на основе отдельных наборов обучения и тестирования. Любой, кто придумает хорошую идею, может испытать огромное облегчение. Спасибо заранее.

-Neo

Ответы [ 2 ]

4 голосов
/ 18 февраля 2011

Возможно, вы просите что-то более конкретное, но в целом:

Вы строите дерево решений с помощью обучающего набора и оцениваете производительность этого дерева, используя набор тестов. Другими словами, в тестовых данных вы вызываете функцию, обычно называемую чем-то вроде c * lassify *, передавая недавно построенное дерево и точку данных (в вашем наборе тестов), которую вы хотите классифицировать.

Эта функция возвращает конечный (конечный) узел из вашего дерева, к которому принадлежит эта точка данных - и, предполагая, что содержимое этого листа является однородным (заполненным данными из одного класса, а не смеси), вы получаете в Суть присваивает метку класса этой точке данных. Когда вы сравниваете эту метку класса, назначенную деревом, с фактической меткой класса точки данных и повторяете ее для всех экземпляров в вашем наборе тестов, у вас есть метрика для оценки производительности вашего дерева.

Эмпирическое правило: перетасуйте свои данные, затем назначьте 90% на тренировочный набор, а остальные 10% на тестовый набор.

0 голосов
/ 19 февраля 2011

На самом деле я искал что-то вроде этого - http://weka.wikispaces.com/Saving+and+loading+models, чтобы сохранить модель, загрузить ее и использовать в тренировочном наборе.Это именно то, что я искал.Надеюсь, это может быть полезно для тех, у кого была такая же проблема, как у меня.ура -Neo182

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...