ПРИМЕЧАНИЕ
- Tensorflow 2.1.0
- Tensorflow Addons 0.8.2
- Python 3.7.2 64-бит
Я создал свой собственный набор данных на основе моих сообщений Telegram. Поэтому я хочу написать чат-бота на основе метода Seq2Seq. Я следую этому туториалу из аддонов Tensorflow
Но позже они пытаются получить ключ от word_index
. Все отлично работает, если слово уже есть в индексе. Но если это не так:
input_raw='hey how are you'
# We have a transcript file containing English-Hindi pairs
# Preprocess X
input_lines = ['<start> '+input_raw+'']
input_sequences = [[en_tokenizer.word_index[w] for w in line.split(' ')] for line in input_lines]
И я получил ошибку:
Exception has occurred: KeyError
'hey'
Что понятно.
Также я нашел этот вопрос, но я не могу понять, как применить решение к моей проблеме.
Как я могу получить некоторый результат со словами, которых нет в обучающем наборе?