Как в облаке я указываю единственное допустимое распределение при обучении классификатора naivebayes, используя алгоритм из пакета "fastNaiveBayes" R с разреженным matix в качестве ввода данных?
У меня есть набор данных, включающий 120000+ терминов данных и 50000+ функций, так что разреженная матрица была бы моим первым вариантом представления данных. Для дальнейшего анализа алгоритм в пакете R "fastNaiveBayes" идеально подходит, потому что он может получить разреженную матрицу в качестве входных данных. Таким образом, после предварительной обработки данных, как требуется, алгоритм обучения вызвал ошибку. Я прочитал официальный документ, но не могу понять, как это исправить. Кто-нибудь может осветить меня или уточнить мою проблему?
Ниже приведены мои коды:
//constructing the sparse matrix
i <- c(train_df$V1)
j <- c(train_df$V2)
x1 <- c(train_df$V3)
data_train_sparse <- sparseMatrix(i,j,x=x1)
//lables for classifier
y <- as.factor(train_lb$V1)
//training algorithm
> mod <- fastNaiveBayes(data_train_sparse, y, laplace=0.1)
Error in fnb.check.args.model(x, y, priors, laplace, sparse, distribution) :
Not a single accepted distribution was specified or all were empty
Я ожидаю отладки своих кодов. Спасибо