Реализация алгоритма максимизации ожидания с NaiveBayes - PullRequest
0 голосов
/ 12 февраля 2012

Я внедрил классификацию наивных байесовских документов с хорошей фильтрацией текста, и я принял статистические результаты с хорошей точностью, мне нужно улучшить свои результаты, используя алгоритм EM.

Но яНе знаю, могу ли я применить алгоритм EM с результатами Наивного-Байеса или применить алгоритм к данным и начать все сначала, поэтому я могу сравнить результаты

В обоих случаях мне нужно понимают алгоритм EM в этом вопросе, потому что он действительно смущает меня

Будем благодарны за любые хорошо объясненные документы

1 Ответ

1 голос
/ 13 февраля 2012

EM обычно помогает вам с немаркированными данными. Если у вас есть немаркированные данные, вы в основном используете их в цикле, подобном этому

estimate some initial parameters, perhaps even randomly
while not converged:
  relabel data using estimates
  update estimates using new labels

Если вы занимаетесь обучением под наблюдением, повторный шаг срывает ваши ярлыки и может ухудшить вашу классификацию.

С другой стороны, это - хороший подробный учебник по полууправляемым наивным байесам для классификации текста. Если у вас есть небольшой набор помеченных документов и большой набор немеченых документов, вы можете использовать их для оценки начальных параметров, а затем выполнить итеративные шаги для немеченых данных и получить лучший классификатор.

...