SweetSpot 04 августа 2020 193

Явная вероятность того, что WordPiece использовался для предварительной обработки BERT

SweetSpot / 04 августа 2020

На каждой итерации алгоритм WordPiece для токенизации подслов объединяет два символа, что увеличивает вероятность больше всего. Теперь в литературе упоминается только, что эта вероятность - это вероятность языковой модели (например, такая же вероятность, используемая при декодировании, в случае NMT). Кто-нибудь знает, какая вероятность использовалась для предварительной обработки BERT?

...

Явная вероятность того, что WordPiece использовался для предварительной обработки BERT

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Явная вероятность того, что WordPiece использовался для предварительной обработки BERT

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы