Question

Учитывая, что BERT двунаправленный, неявно ли он моделирует подсчет слов в некотором заданном тексте? Я спрашиваю в случае классификации описаний столбцов данных как действительные или нет. Я ищу модель, основанную на количестве слов, и мне было интересно, нужно ли это делать, учитывая, что BERT двунаправленный.

Ashwin Geet D'Sa · Answer 1 · 25 июня 2019

BERT по умолчанию учитывает токенизацию "word-piece", а не токенизацию "word".BERT делает доступным атрибут max-sequence length, который отвечает за ограничение числа токенов в каждом предложении, а также обеспечивает обработку равного количества токенов.

BERT неявно моделирует количество слов?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

BERT неявно моделирует количество слов?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов