Я строю модели для набора данных SQUAD (Стэнфордский вопрос-ответ) (https://rajpurkar.github.io/SQuAD-explorer). Стэнфорд не выпускает свой тестовый набор. Он предоставляет нам только обучение и набор данных dev.
Вотмой вопрос:
Когда я настраивал гиперпараметры разных моделей, я настраивал их на данные "dev", предоставленные Стэнфордом. Однако мы рассматривали набор "dev" как набор "test", поскольку у нас не былодоступ к реальным данным "тестирования". Мы выбираем только 1 модель для отправки среди различных моделей на основе производительности набора данных "dev".
, поэтому мне было интересно, должен ли я разделить обучающий набор дальше наtrain и dev, и настроили гиперпарамы на недавно отделенном наборе dev, а не на dev, заданном Stanford, поскольку мы используем набор dev в качестве набора test. Я как-то обманывал? Нужно ли создавать другой?dev "данные из существующих данных поезда, разбивая их дальше, и настраивая там гиперпарамы, и проверяя число перфораторов на заданном наборе" dev "?