Наивная байесовская точность увеличивается с увеличением значения альфа - PullRequest
0 голосов
/ 13 сентября 2018

Я использую наивный байесовский анализ для классификации текста, и у меня есть записи по 100 КБ, в которых 88 КБ являются положительными записями классов, а 12 КБ являются отрицательными записями классов.Я преобразовал предложения в униграммы и биграммы, используя countvectorizer, и взял альфа-диапазон от [0,10] с 50 значениями, и я рисую график.enter image description here

При аддитивном сглаживании Лапласа, если я продолжу увеличивать альфа-значение, то также возрастает точность набора данных перекрестной проверки.Мой вопрос: эта тенденция ожидается или нет?

1 Ответ

0 голосов
/ 13 сентября 2018

Если вы продолжите увеличивать альфа-значение, то наивная байесовская модель будет смещена в сторону класса, который имеет больше записей, и модель становится немой моделью (недостаточной подгонкой), поэтому выбор небольшого альфа-значения - хорошая идея.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...