Можно ли установить весы для признаков при классификации с использованием наивного байесовского метода в Spark? - PullRequest
0 голосов
/ 10 января 2019

В моем приложении Spark я использую NaiveBayesModel для классификации текстовых документов. Допустим, моя модель выглядит так:

class SomeDocument {
    String text;
    String lead;
}

Мой текущий подход состоит в том, чтобы токенизировать весь документ, включая text и lead, и обрабатывать каждый токен как черту. Это не соответствует бизнес-правилам, которым нужно lead, чтобы быть более важным в классификации, чем text. Другими словами, мне нужно установить вес для токена, а значение веса должно зависеть от источника (lead из text).

Я тренирую свою модель, используя метод NaiveBayes.train.

Вопрос: Как установить весы для черт?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...