DeprecationWarning: вызов устаревшего `__getitem__` - PullRequest
0 голосов
/ 20 апреля 2020

Я уже несколько дней пытаюсь решить эту ошибку, и мне просто не удается найти причину, я пытался изменить код с embedding_matrix [i] = model [vocab [i]] на embedding_matrix [i ] = model.wv [vocab [i]], в этом случае я не получаю устаревшую ошибку, но все равно получаю erorr с этой строкой (25), может кто-нибудь сказать мне, что не так, пожалуйста

  from gensim.models import Word2Vec
import re

vocab = []
for word in tokenizer.word_index:
    vocab.append( word )

def tokenize( sentences ):
    tokens_list = []
    vocabulary = []
    for sentence in sentences:
        sentence = sentence.lower()
        sentence = re.sub( '[^a-zA-Z]', ' ', sentence )
        tokens = sentence.split()
        vocabulary += tokens
        tokens_list.append( tokens )
    return tokens_list , vocabulary

p = tokenize( questions + answers )
model = Word2Vec( p[ 0 ] ) 

embedding_matrix = np.zeros( ( VOCAB_SIZE , 100 ) )
for i in range( len( tokenizer.word_index ) ):
    embedding_matrix[ i ] = model[vocab[i]]

# encoder_input_data
tokenized_questions = tokenizer.texts_to_sequences( questions )
maxlen_questions = max( [ len(x) for x in tokenized_questions ] )
padded_questions = preprocessing.sequence.pad_sequences( tokenized_questions , maxlen=maxlen_questions , padding='post' )
encoder_input_data = np.array( padded_questions )
print( encoder_input_data.shape , maxlen_questions )

Я получаю следующую ошибку:

 /usr/local/lib/python3.6/dist-packages/ipykernel_launcher.py:25: DeprecationWarning: Call to deprecated `__getitem__` (Method will be removed in 4.0.0, use self.wv.__getitem__() instead).
---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-11-29183abd3d2d> in <module>()
     23 embedding_matrix = np.zeros( ( VOCAB_SIZE , 100 ) )
     24 for i in range( len( tokenizer.word_index ) ):
---> 25     embedding_matrix[ i ] = model[vocab[i]]
     26 
     27 # encoder_input_data

Заранее спасибо!

...