NLTK wordnet вычисление пути сходства слов в двух списках - PullRequest
0 голосов
/ 13 декабря 2018

Я пытаюсь найти сходство слов в текстовом файле.Я приложил код ниже, где я читал из текстового файла и разделил содержимое на два списка, но теперь я хотел бы сравнить слова из списка 1 с списком 2.

file = open('M:\ThirdYear\CE314\Assignment2\sim_data\Assignment_Additional.txt', 'r')
word1 = []
word2 = []

split = [line.strip() for line in file]
count = 0

for line in split:
    if count == (len(split) - 1):
        break
    else:
        word1.append(line.split('\t')[0])
        word2.append(line.split('\t')[1])
        count = count + 1  

print(word1)
print(word2)

for x, y in zip(word1, word2):
    w1 = wordnet.synset(x + '.n.1')
    w2 = wordnet.synset(y + '.n.1')
    print(w1.path_similarity(w2))

Я хочу перебратьи списки, и печатают их путь_схожести, но только если они соответствуют правилам wordnet.synset (x + '.n.1'), означающим любые слова, которые не имеют '.n.1', я хочу игнорировать и пропустить, но яне совсем уверен, как сделать эту проверку в Python

...