Я хотел бы извлечь ключевые слова из предложения с учетом list_of_keywords.
Мне удалось извлечь точные слова
[word for word in Sentence if word in set(list_of_keywords)]
Можно ли извлечь слова, которые имеют хорошее сходство сзаданный list_of_keywords, т. е. косинусное сходство между двумя словами составляет> 0,8
Например, ключевое слово в данном списке - «аллергия», и теперь предложение записывается как
- серьезная аллергическая реакция наорехи в еде, которую она употребляла. '
расстояние между косинусами между «аллергией» и «аллергией» можно рассчитать, как показано ниже
cosdis(word2vec('allergy'), word2vec('allergic'))
Out[861]: 0.8432740427115677
Как извлечь «аллергию» из предложения какхорошо на основе косинуса сходства?