Анализатор разделителя Арангодба - PullRequest
1 голос
/ 05 февраля 2020

Я хочу создать анализатор для токенизации символов вместо слов. например, Foo будет размечен на ['F', 'o', 'o'], так что поиск TFIDF будет основан на частоте символов вместо слов ...

Я опробовал ниже, но, кажется, не работает.

a.save ('emailAnalyzer1', 'delimiter', {local: 'en.UTF-8', case: 'upper', delimiter: '', stopwords : ['@', '+', '.']})

любая помощь очень ценится.

...