Быстрый и грязный ответ заключается в том, что wordnet делает это уже :
Остальныевопрос заключается в том, как сделать это программно (без веб-очистки).
Добавлено:
Средство обертки библиотеки wordnet довольно мощное и демонстрирует то, что кажется широтой интерфейса библиотеки C:
$ wn happy
No information available for noun happy
No information available for verb happy
Information available for adj happy
-antsa Antonyms
-synsa Synonyms (ordered by estimated frequency)
-attra Attributes
-deria Derived Forms
-famla Familiarity & Polysemy Count
-grepa List of Compound Words
-over Overview of Senses
$ wn happy -deria -n1
Derived Forms of adj happy
Sense 1
happy (vs. unhappy)
RELATED TO->(noun) happiness#1
=> happiness, felicity
RELATED TO->(noun) happiness#2
=> happiness
Таким образом, в Python вы можете либо subprocess
использовать команду wn, которая выглядит довольно неаккуратно, либо использовать средства wordnet, уже встроенные в NLTK.
В Ubuntu (и, вероятно, Debian)) библиотеки и инструменты wordnet удобно доступны с:
sudo apt-get install wordnet wordnet-dev
Увы:
$ wn pythonic
No information available for pythonic