Python NLTK извлекает синонимы из вложенного списка наборов синонимов - PullRequest
0 голосов
/ 02 мая 2020

У меня есть вложенный список из 65 наборов синонимов в формате NLTK. Например,

print(synsets[0])
[Synset('friendly.n.01'), Synset('friendly.a.01'), Synset('friendly.s.02'), Synset('friendly.a.03'), Synset('friendly.a.04')]

Я хочу создать новый вложенный фрейм данных (длина 65), чьи «внешние» элементы - это 65 слов, а внутренние элементы - это синонимы каждого слова. Как мне это сделать? Вот что у меня есть: import os import pandas as pd из nltk.corpus import wordnet import nltk nltk.download ('wor dnet')

base = os.path.normpath(r"/Users/rahelmizrahi/Python/scripts/POMS word list.csv")
x = pd.DataFrame(pd.read_csv(base)) #x = basewords in df format
basewords = list(x.iloc[:,0]) # 1d list of 65 words

synsets = [wordnet.synsets(word) for word in basewords] # nested NLTK object I want to transform


Synsets = []
i = 0
synonyms = []   
for synset in synsets:
    for syn in synset: 
        for l in syn.lemmas(): 
            Synsets[i].append(l.name()) 
i = i +1

Я получаю ошибку: 'list индекс вне диапазона '

...