Другой подход к этому - встраивание слов. В этом случае вместо того, чтобы кодировать слова, используя горячие векторы, вы кодируете их, используя плотные элементы, подобные изображению ниже.
Это изображение демонстрирует подход уменьшения размерности, но технический прием можно использовать так же, как ввод к модели.
Обновление
Лучшим подходом для текстовых задач являются Рекуррентные нейронные сети (RNN) ) нравится ЛСТМ и ГРУ. Эти сети, применительно к текстовым задачам, предсказывают вывод на основе одер-слов текста. На рисунке ниже показан пример RNN.
«X» - это входные данные, X1 - первое слово, X2 - второе слово, Xt - последнее слово и «W» - информация распространяется по сети. Используя эту схему, модель сделает прогноз на основе информации всего вашего текста, зная не только символы, но и взаимосвязь между словами.