Разделение данных в обучении, валидации и тестировании в независимой 10-кратной перекрестной валидации? - PullRequest
0 голосов
/ 18 декабря 2018

Я работаю над анализом эмоций.Недавние работы в этой области выполняют независимую от k-кратную перекрестную проверку.Но я не видел ни одной статьи, которая использует набор проверки.Они упоминают только набор поездов и набор тестов.Например, при 10 перекрестной проверке весь набор данных делится на 10 независимых от субъекта наборов (sub1 будет входить только в один набор, а не в другой).Если мы разделим набор данных только на тренировку и тестирование, то как будут настроены гиперпараметры.Какая будет окончательная точность, так как моя точность варьируется (1% -4%), в то время как точность поезда достигает 99,99%.

1 Ответ

0 голосов
/ 18 декабря 2018

Перекрестная проверка - это процесс создания наборов проверки и обучения по ним.Вы можете настроить гиперпараметры, отслеживая показатели проверки во время перекрестной проверки.Если ваша точность проверки составляет 1-4%, а точность обучения близка к идеальной, то ваша модель переоснащается (очень много). Есть много способов борьбы с переобучением, но многие из них зависят от модели, поэтому я 'Мне нужно больше информации, чтобы помочь в дальнейшем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...