Я уточняю модель BERT, но мне нужно добавить несколько тысяч слов.Я знаю, что можно заменить ~ 1000 [unused#]
строк в верхней части vocab.txt, но я также заметил, что в файле есть тысячи одиночных иностранных символов (юникод), которые я никогда не буду использовать.Для тонкой настройки, возможно ли заменить их моими словами, точной настройкой, и модель по-прежнему работает правильно?