Как использовать слова, которые не присутствуют в word_index в Tensorflow? - PullRequest
0 голосов
/ 28 февраля 2020

ПРИМЕЧАНИЕ

  • Tensorflow 2.1.0
  • Tensorflow Addons 0.8.2
  • Python 3.7.2 64-бит

Я создал свой собственный набор данных на основе моих сообщений Telegram. Поэтому я хочу написать чат-бота на основе метода Seq2Seq. Я следую этому туториалу из аддонов Tensorflow

Но позже они пытаются получить ключ от word_index. Все отлично работает, если слово уже есть в индексе. Но если это не так:

input_raw='hey how are you'

# We have a transcript file containing English-Hindi pairs
# Preprocess X
input_lines = ['<start> '+input_raw+'']
input_sequences = [[en_tokenizer.word_index[w] for w in line.split(' ')] for line in input_lines]

И я получил ошибку:

Exception has occurred: KeyError
'hey'

Что понятно.

Также я нашел этот вопрос, но я не могу понять, как применить решение к моей проблеме.

Как я могу получить некоторый результат со словами, которых нет в обучающем наборе?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...