Идея состоит в том, что мне нужно выяснить, сколько чувств выровнено по каждому слову в корпусе с использованием WordNet.Затем я возьму 10 наиболее часто встречающихся слов, которые имеют 2 значения, и реализую контролируемый алгоритм устранения неоднозначности значений слов.
Хотя я не могу пройти этот этап.
for word in corpus:
if (len(wn.synsets(word)) = 2)
return word
Это все, что я могу собрать из своих знаний, хотя синтаксис совершенно неправильный.