Как получить список частей речи и слов из Принстонского английского WordNet? - PullRequest
0 голосов
/ 21 апреля 2019

Я хотел бы получить полный список частей речи (например, прил., Adv. И .v) для английских слов. Все, что мне нужно, это просто таблица TSV с двумя столбцами, в первом столбце слово, а во втором столбце POS.

Я знаю, что wordnet должен содержать такую ​​информацию. Но он содержит больше, чем мне нужно. Я не уверен, какой файл мне следует использовать.

https://wordnet.princeton.edu/download

Кто-нибудь знает удобный для использования файл, который содержит английские слова и их POS? Спасибо.

1 Ответ

0 голосов
/ 23 апреля 2019

Wordnet не дает вам «слово» за слово, но леммы.

from nltk.corpus import wordnet as wn

for ss in wn.all_synsets():
    for lemma in ss.lemma_names():
        print(ss.offset() + '\t' + ss.pos() +'\t' + lemma)

См.

...