Этот вопрос немного широк, но вы можете начать его следующим образом:
Вы, вероятно, можете использовать Cola
процессор Берт, который является подходящим процессором для задачи двоичной классификации.
Вы можете рассматривать Названия в качестве идентификатора, поскольку они не должны влиять на обучение, и они могут однозначно идентифицировать описание.
Создайте файлы TSV в соответствии с необходимой проблемой, вы можете использовать данные Glue для задачи Cola, чтобыПосмотрите, как данные должны быть отформатированы для bert.
Как правило, обучающий набор Dev имеет 4 столбца, а именно id
, class
, segment ID
, text data
, а тестовый набор имеет только 2столбцы id
и text data
.
Точную настройку можно выполнить после получения данных в требуемом формате.Вы можете использовать скрипт run_classifier.py
для тонкой настройки.Авторы документировали способ использования упомянутого скрипта для тонкой настройки здесь