Я хотел бы сделать некоторую классификацию текста (наивный байесовский) с Weka, используя простую cli (командную строку), но у меня есть одна проблема. Weka не может обрабатывать строки, они должны быть преобразованы.
Но как я могу преобразовать строки в моем файле arff через cli?
предложений.арфф пример
@relation data set
@attribute text string
@attribute class {swedish,'?',english}
@data
'detta är en svensk text',swedish
'this is an english text',english
'what is the name of this book?',english
'vilken färg är en liten stuga?',swedish
'you are the best',english
'en enstaka fjäder i hatten fördröjer livet ett tag',swedish
'detta är en annan svensk text',swedish
Я использую следующую команду для создания модели
java weka.classifiers.bayes.NaiveBayes -t data.arff -d data.model