Я пишу программу, в которой у меня есть счетчик (collections.counter
) с именем vocabulary
, который является 10000 наиболее часто встречающимся счетчиком с именем wordFrequency
, созданным из подсчета экземпляров слов, прочитанных из текстового файла. Я застрял при попытке сделать оператор if, который проверяет, найден ли элемент в этом счетчике. То, что у меня есть:
vocabulary = wordFrequency.most_common(10000)
[...]
for line in trainReader2:
if len(line) == 10 and line[5] != "_":
if wordPosition < matrixWidth:
word = line[1]
if word in vocabulary:
sentenceRow[wordPosition] = word
else:
sentenceRow[wordPosition] = "[unknown]"
wordPosition += 1
elif wordPosition != 0:
trainingMatrix.append(sentenceRow)
print("sentence row:", sentenceRow)
wordPosition = 0
sentenceRow = ["[padding]"] * matrixWidth
Я точно думал, что if word in vocabulary:
сработает, но условие никогда не выполняется, и строки предложений всегда полностью состоят из [unknown]
и [padding]
. Что если заявление я должен использовать для этой ситуации?