Я хочу использовать NLP stemming для текстового файла с помощью node.js, а затем сохранить его в каком-нибудь выходном файле.Пожалуйста, дайте мне знать, если вам нужна дополнительная информация.
Я использую npm natural и PorterStemmer, чтобы сделать то же самое, но безуспешно.
function doStem(data){
var natural = require('natural');
//do procesing using WordTokenizer & PorterStemmer.
return nData;
}
Пожалуйста, дайте мне знать, если я используюПравильный подход или дайте мне знать, если что-то нужно исправить.
ОБНОВЛЕНИЕ:
function doStemming(data){
var natural = require('natural');
var tokenizer = new natural.WordTokenizer();
var tokens = tokenizer.tokenize(data);
stemmer = natural.PorterStemmer(data);
var nData = stemmer.stem(tokens);
//console.log(nData);
return nData;
}
Это то, что я делаю.Пожалуйста, дайте некоторое представление о том, как сделать это с помощью токенизации и PorterStemmer в текстовый файл, но не на какое-либо конкретное слово