Как обрабатывать пропущенные значения в данных при применении гауссовского наивного байесовского алгоритма для его классификации - PullRequest
0 голосов
/ 25 марта 2019

В наборе данных, к которому я применяю Наивный байес, есть некоторые пропущенные значения. что приводит к нулевой условной вероятности некоторых классов по некоторым атрибутам. Я применяю метод Гаусса для вычисления условных вероятностей. Я рассчитываю среднее значение и стандартное отклонение для каждого атрибута по отношению к каждому классу. Из-за некоторых пропущенных значений sd и mean равны нулю, что делает условную вероятность нулевой, и, в свою очередь, общая вероятность для класса становится равной нулю. Должен ли я применить подход сглаживания по методу Лапласа / м-оценки?

...