В настоящее время я работаю над своей диссертацией, которая связана с автоматическим ответом на вопрос с использованием перевода набора данных SQUAD Стэнфорда на итальянский язык.Я собираюсь использовать Google BERT https://github.com/google-research/bert, поскольку он пока дает лучшие результаты в соревнованиях SQUAD.Google предоставил многоязычную предварительно обученную модель для многих языков, включая итальянский.
Стоит ли выпускать одноязычную модель Google BERT только для итальянского?Я предполагаю, что модель на одном языке означает, что меньшая сеть означает меньшее время обучения и меньший размер.