ws = {}
nlp = spacy.load('de_core_news_sm')
data = 'Some long text'
train_corpus = nlp(data)
train_corpus = [token.text for token in train_corpus if not token.is_stop and len(token) > 4]
test_corpus = nlp('Some short sentence')
ae = train_corpus.similarity(test_corpus)
Я получаю AttributeError: 'list' object has no attribute 'similarity'
на ae = train_corpus.similarity(test_corpus)
. Если я удаляю train_corpus = [token.text for token in train_corpus if not token.is_stop and len(token) > 4]
, он работает, но со стоп-словами.
Как мне удалить стоп-слова, чтобы он все еще работал?
РЕДАКТИРОВАТЬ: ae = nlp(train_corpus).similarity(test_corpus)
приводит к TypeError: Argument 'string' has incorrect type (expected str, got list)
.