Какую библиотеку вы используете? В любом случае, да, вам придется сопоставлять каждую единицу ввода (каждую точку данных) с идентификаторами слов. Например, если ниже приведен один твит, который вы хотите передать своей модели:
лиса перепрыгивает через коричневого пса
это будет преобразовано через словарь во вход, состоящий полностью из идентификаторов слов (с некоторыми дополнениями, основанными на том, как спроектирован ваш LSTM)
23 69 10 4 254 145
эти числа могут быть сохранены в массиве, например, перед тем, как передать их в сеть и дать настроение (скажем, 0,54) в качестве ожидаемого результата.