Зачем GPT добавлять маркер [CLS] при настройке? - PullRequest
0 голосов
/ 01 октября 2019

Я знаю, что скрытое состояние токена CLS можно рассматривать как представление всего предложения. Почему бы не использовать скрытое состояние последнего слова напрямую?

Заранее спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...