Прилагательное Номинализация в Python NLTK - PullRequest
5 голосов
/ 14 мая 2010

Есть ли способ получить прилагательные номинализации Wordnet, используя NLTK? Например, для «счастливого» желаемого результата будет «счастье».

Я пытался покопаться, но ничего не смог найти.

Спасибо!

Ответы [ 2 ]

4 голосов
/ 15 мая 2010

Быстрый и грязный ответ заключается в том, что wordnet делает это уже :

  • S: (прил.) Счастливая (наслаждающаяся или показывающая или отмеченная радостью или удовольствием) «счастливая улыбка»;«провел много счастливых дней на пляже»;"счастливый брак"

    • атрибут
      • S: (n) счастье, счастье (состояние благополучия, характеризующееся эмоциями, варьирующимися от удовлетворения до сильной радости)
      • S: (n) счастье (эмоции, испытываемые в состоянии благополучия)
    • деривационно связанная форма
      • W: (n) счастье [Относится к: счастливому] (состояние благополучия характеризуется эмоциями, варьирующимися от удовлетворения до сильной радости)
      • W: (n) счастье [Связано с: happy] (эмоции, испытываемые в состоянии благополучия)

Остальныевопрос заключается в том, как сделать это программно (без веб-очистки).

Добавлено:

Средство обертки библиотеки wordnet довольно мощное и демонстрирует то, что кажется широтой интерфейса библиотеки C:

$ wn happy
No information available for noun happy
No information available for verb happy
Information available for adj happy
    -antsa      Antonyms
    -synsa      Synonyms (ordered by estimated frequency)
    -attra      Attributes
    -deria      Derived Forms
    -famla      Familiarity & Polysemy Count
    -grepa      List of Compound Words
    -over       Overview of Senses
$ wn happy -deria -n1
Derived Forms of adj happy
Sense 1
happy (vs. unhappy)
       RELATED TO->(noun) happiness#1
           => happiness, felicity
       RELATED TO->(noun) happiness#2
           => happiness

Таким образом, в Python вы можете либо subprocess использовать команду wn, которая выглядит довольно неаккуратно, либо использовать средства wordnet, уже встроенные в NLTK.

В Ubuntu (и, вероятно, Debian)) библиотеки и инструменты wordnet удобно доступны с:

sudo apt-get install wordnet wordnet-dev

Увы:

$ wn pythonic
No information available for pythonic
0 голосов
/ 16 мая 2010

Или вы можете просто задать тот же вопрос на nltk-users .

...