Построение модели самообслуживания на уровне персонажа является сложной задачей.Модели уровня персонажа обычно основаны на RNN.В то время как в модели слово / подслово с самого начала ясно, что представляют собой единицы, несущие значение (и, следовательно, единицы, на которые может обратить внимание механизм внимания), модель уровня персонажа должна изучить значение слова в следующих слоях.Это усложняет изучение модели.
Модели генерации текста - не более чем модель условных языков.AI Google недавно опубликовал статью о модели языка символов Transformer , но это единственная работа, которую я знаю.
В любом случае, вы должны рассмотреть возможность использования единиц подслов (как BPE, SentencePiece) илиесли вам действительно нужно перейти на уровень персонажа, используйте вместо этого RNN.