Я хочу создать анализатор для токенизации символов вместо слов. например, Foo будет размечен на ['F', 'o', 'o'], так что поиск TFIDF будет основан на частоте символов вместо слов ...
Я опробовал ниже, но, кажется, не работает.
a.save ('emailAnalyzer1', 'delimiter', {local: 'en.UTF-8', case: 'upper', delimiter: '', stopwords : ['@', '+', '.']})
любая помощь очень ценится.