Я хочу извлечь особенности из предварительно обученного встраивания Перчатки. Но я получил Keyerror за определенные слова. Вот список слов токена.
words1=['nuclear','described', 'according', 'called','physics', 'account','interesting','holes','theoretical','like','space','radiation','property','impulsed','darkfield']
Я получил Кейеррор из слов «импульсный», «темное поле», потому что, вероятно, это невидимые слова. Как я могу избежать этой ошибки? ,
Вот мой полный код:
gloveFile = "glove.6B.50d.txt"
import numpy as np
def loadGloveModel(gloveFile):
print ("Loading Glove Model")
with open(gloveFile, encoding="utf8" ) as f:
content = f.readlines()
model = {}
for line in content:
splitLine = line.split()
word = splitLine[0]
embedding = np.array([float(val) for val in splitLine[1:]])
model[word] = embedding
print ("Done.",len(model)," words loaded!")
return model
model = loadGloveModel(gloveFile)
words1=['nuclear','described', 'according', 'called','physics', 'account','interesting','holes','theoretical','like','space','radiation','property','impulsed','darkfield']
import numpy as np
vector_2 = np.mean([model[word] for word in words1],axis=0) ## Got error message
Сообщение об ошибке для слова «импульс»
Есть ли способ пропустить эти невидимые слова?.