Question

Я использую наивный байесовский анализ для классификации текста, и у меня есть записи по 100 КБ, в которых 88 КБ являются положительными записями классов, а 12 КБ являются отрицательными записями классов.Я преобразовал предложения в униграммы и биграммы, используя countvectorizer, и взял альфа-диапазон от [0,10] с 50 значениями, и я рисую график.

При аддитивном сглаживании Лапласа, если я продолжу увеличивать альфа-значение, то также возрастает точность набора данных перекрестной проверки.Мой вопрос: эта тенденция ожидается или нет?

Miguel A. Friginal · Answer 1 · 13 сентября 2018

Если вы продолжите увеличивать альфа-значение, то наивная байесовская модель будет смещена в сторону класса, который имеет больше записей, и модель становится немой моделью (недостаточной подгонкой), поэтому выбор небольшого альфа-значения - хорошая идея.

Наивная байесовская точность увеличивается с увеличением значения альфа

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Наивная байесовская точность увеличивается с увеличением значения альфа

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы