Я хочу преобразовать текст в последовательность, используя керас с индонезийскими языками.но токенайзер keras обнаруживает только известное слово.
Как добавить известные слова в keras?или какое-нибудь решение для меня, чтобы преобразовать текст в последовательность?
from keras.preprocessing.text import Tokenizer
tokenizer = Tokenizer(num_words=n_most_common_words, filters='!"#$%&()*+,-./:;<=>?@[\]^_`{|}~', lower=True)
tokenizer.fit_on_texts(concated['TITLE'].values)
txt = ["bisnis di indonesia sangat maju"]
seq = list(tokenizer.texts_to_sequences_generator(txt))
переменная "seq", приводящая к пустому массиву, если я использовал индонезийские языки, его работа отлично, если я использовал английское слово.как использовать керасы для разных языков?или вообще добавить какое-нибудь известное слово в керас?
Спасибо