Я пытался создать RNN, который предсказывает, является ли строка engli sh или нет.
Он основан на этом примере: https://www.tensorflow.org/tutorials/load_data/text
Однако, когда я использую функцию model.predict, она дает больше прогнозов, чем введенные мной данные. Я выяснил, что нейронная сеть не делает прогноз для всей строки в одной строке, но если она разделена не алфавитными / числовыми символами c, ie: asd [gfds] gas, она вернет прогноз для asd, gfds и gas, но не для asd [gsds] gas.
Мне было интересно, есть ли у кого-нибудь понимание того, почему. Созданный мной rnn и данные, которые я ввожу в model.predict (), токенизируются / кодируются точно так же, как и в руководстве по тензорному потоку.