У меня есть вложенный список из 65 наборов синонимов в формате NLTK. Например,
print(synsets[0])
[Synset('friendly.n.01'), Synset('friendly.a.01'), Synset('friendly.s.02'), Synset('friendly.a.03'), Synset('friendly.a.04')]
Я хочу создать новый вложенный фрейм данных (длина 65), чьи «внешние» элементы - это 65 слов, а внутренние элементы - это синонимы каждого слова. Как мне это сделать? Вот что у меня есть: import os import pandas as pd из nltk.corpus import wordnet import nltk nltk.download ('wor dnet')
base = os.path.normpath(r"/Users/rahelmizrahi/Python/scripts/POMS word list.csv")
x = pd.DataFrame(pd.read_csv(base)) #x = basewords in df format
basewords = list(x.iloc[:,0]) # 1d list of 65 words
synsets = [wordnet.synsets(word) for word in basewords] # nested NLTK object I want to transform
Synsets = []
i = 0
synonyms = []
for synset in synsets:
for syn in synset:
for l in syn.lemmas():
Synsets[i].append(l.name())
i = i +1
Я получаю ошибку: 'list индекс вне диапазона '