Лучший алгоритм обучения для принятия дерева решений в Java? - PullRequest
11 голосов
/ 13 октября 2009

У меня есть наборы данных с информацией о возрасте, городе, возрасте детей, ... и результатах (подтвердить, принять).

Чтобы помочь в моделировании «рабочего процесса», я хочу автоматически создать дерево решений на основе предыдущих наборов данных.

Я взглянул на http://en.wikipedia.org/wiki/Decision_tree_learning и знаю, что проблема явно не очевидна.

Я просто хочу получить совет по какому-нибудь алгоритму или библиотекам по этому вопросу, что может помочь мне в построении дерева решений на основе выборок.

Ответы [ 2 ]

14 голосов
/ 13 октября 2009

Вам стоит взглянуть на Weka , бесплатный учебный комплект на основе Java.

После преобразования ваших данных в простой текстовый .arff формат Weka вы сможете использовать графический интерфейс или интерфейс командной строки для обучения и тестирования различных классификаторов на этих данных, в том числе :

  • деревья решений
  • нейронные сети
  • основанные на правилах системы
  • опорные векторные машины (SVM)
  • различные типы регрессии

Эксперименты с этим интерфейсом позволят вам легко попробовать различные классификаторы и параметры обучения, чтобы определить, какие из них лучше всего работают с вашими данными.

Вы также можете использовать API для интеграции Weka в ваш собственный исходный код .

2 голосов
/ 17 мая 2010

Если вы хотите сравнить производительность различных типов деревьев решений от Weka, посмотрите результаты тестирования, собранные на TunedIT.org:

http://tunedit.org/results?d=UCI&a=Weka*tree.

Поиграйте с выпадающими списками и названиями алгоритмов / наборов данных, чтобы выбрать, какие результаты следует представить.

...