Как обучить классификатор NaiveBayes с разреженными матричными данными без ошибок с помощью пакета R fastNaiveBayes? - PullRequest
0 голосов
/ 03 октября 2019

Как в облаке я указываю единственное допустимое распределение при обучении классификатора naivebayes, используя алгоритм из пакета "fastNaiveBayes" R с разреженным matix в качестве ввода данных?

У меня есть набор данных, включающий 120000+ терминов данных и 50000+ функций, так что разреженная матрица была бы моим первым вариантом представления данных. Для дальнейшего анализа алгоритм в пакете R "fastNaiveBayes" идеально подходит, потому что он может получить разреженную матрицу в качестве входных данных. Таким образом, после предварительной обработки данных, как требуется, алгоритм обучения вызвал ошибку. Я прочитал официальный документ, но не могу понять, как это исправить. Кто-нибудь может осветить меня или уточнить мою проблему?

Ниже приведены мои коды:

//constructing the sparse matrix
i <- c(train_df$V1)
j <- c(train_df$V2)
x1 <- c(train_df$V3)
data_train_sparse <- sparseMatrix(i,j,x=x1)
//lables for classifier
y <- as.factor(train_lb$V1)
//training algorithm
> mod <- fastNaiveBayes(data_train_sparse, y, laplace=0.1)
Error in fnb.check.args.model(x, y, priors, laplace, sparse, distribution) : 
  Not a single accepted distribution was specified or all were empty

Я ожидаю отладки своих кодов. Спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...