Все слова и их индексы будут сохранены в словаре, к которому вы можете получить доступ, используя tokenizer.word_index
.Следовательно, вы можете найти количество уникальных слов на основе количества элементов в этом словаре:
num_words = len(tokenizer.word_index) + 1
Это + 1
из-за резервирования заполнения (т. Е. Индекса ноль).
Примечание : Это решение (очевидно) применимо, когда вы не установили аргумент num_words
(т.е. вы не знаете или не хотите ограничивать количество слов), поскольку word_index
содержит все слова (и не только самые частые слова), независимо от того, установлен ли вы num_words
или нет.