Пожалуйста, помогите мне выбрать правильный классификатор - PullRequest
4 голосов
/ 11 октября 2010

У меня проблема с выбором правильного классификатора для моей задачи интеллектуального анализа данных.

Я маркирую веб-страницы статистическим методом и маркирую их по шкале 1-4, 1 - самый бедный, а 4 - лучший.

Раньше я использовал SVM для обучения системы, так как тогда я использовал двоичную (1,0) метку. Но теперь, когда я переключаюсь на эту метку 4 класса, мне нужно изменить классификатор, потому что я думаю, что классификатор SVM будет работать только для двухклассовой классификации (исправьте меня, если я ошибаюсь).

Итак, не могли бы вы предложить здесь некоторые предположения о том, какой классификатор наиболее ценится здесь для моей цели классификации.

Заранее спасибо за предложения.

Ответы [ 3 ]

6 голосов
/ 11 октября 2010

Существуют мультиклассовые SVM. LibSVM имеет реализацию, как и Weka .

Обычно лучше поэкспериментировать с несколькими классификаторами, чтобы выяснить, какой из них лучше всего работает с вашими данными.Выбор типа классификатора и алгоритма обучения далеко менее важен, чем выбранный вами набор функций.Вы можете попробовать наивный Байес, мультиклассовый SVM, MaxEnt, проголосовавших персептроны или все, что предлагает ваша библиотека.

2 голосов
/ 11 октября 2010

Вы говорите о «порядковой классификации».Его можно изменить , используя SVM (как уже упоминалось, он также реализован в libSVM), используя логистическую регрессию и даже , используя деревья решений или искусственныенейронные сети.

Вы можете даже продолжить свои метки, выполнить регрессионный анализ по вашему выбору, а затем расшифровать результаты.Большинство методов, которые я упомянул выше, делают это за кулисами.

Удачи

1 голос
/ 25 октября 2010

Вы можете попробовать прочитать лекцию Эндрю Н.Г. о том, как выбрать подходящий алгоритм ML, который, на мой взгляд, весьма полезен, и он может дать вам некоторое представление о том, как управлять вашими данными

...