Вы можете начать с реализации spacy sense2vec . Он основан на оригинальной бумаге sense2vec . Из аннотации:
В этой статье представлен новый подход, который решает эти проблемы, моделируя множественные вложения для каждого слова на основе контролируемой неоднозначности, что обеспечивает быстрый и точный способ для модели потребителя НЛП выбрать встраивание с неоднозначностью смысла. Мы демонстрируем, что эти вложения могут устранить неоднозначность как контрастных чувств, таких как номинальные и словесные, так и нюансов, таких как сарказм.