У меня есть набор сообщений с веб-сайта о конкретном c домене. Я хочу изучить вложения для слов в этом наборе данных. Но, насколько я понимаю, тонкая настройка BERT предназначена для тонкой настройки предварительно обученных вложений для конкретной c задачи, такой как классификация. Есть ли способ узнать о встраивании новых слов в мой набор данных, используя такие модели, как BERT (обучение с нуля или точная настройка)?