Я немного покопался и обнаружил, что в обработке есть несколько «смещений», которые необходимо отменить, чтобы получить разумный язык обзора. Я изменил вашу строку, чтобы вычесть 3 из индекса, который появляется в необработанной последовательности (так как по умолчанию это начало реальных слов с индексом = 3), а также первый символ - фиктивный маркер (установлен в 1), поэтому реальный текстначинается с позиции 2 (или индекса 1 в python).
train_ex = [idx2words[x-3] for x in train_data_raw[0][1:]]
Использование вышеуказанной модификации дает мне следующее для обзора, который вы первоначально выбрали:
this film was just brilliant casting location scenery story direction everyone's really suited the part they played ...
Кажется, что некоторые знаки препинанияи капитализация удалена и т. д., но это, кажется, возвращает разумные отзывы.
Я надеюсь, что это помогает.