Нужна ли одна и та же модель CNN разные скорости обучения для разных наборов данных? - PullRequest
0 голосов
/ 30 октября 2019

Я использовал модели сверточной нейронной сети для сегментации медицинских изображений. Когда я тренирую модели (например, модель Тирамису 1 ), я пробовал те же скорости обучения, которые рекомендованы в статье, однако я получаю плохие результаты.

Меня беспокоитНужно найти другую оптимальную скорость обучения, когда мы используем модель для другого набора данных. Например, в этом случае они используют набор данных CamVid (улицы, автомобили, люди и т. Д.), А я использую медицинские изображения.

1 Ответ

0 голосов
/ 30 октября 2019

Хотя может существовать некоторый набор параметров, которые работают достаточно хорошо для большинства случаев (которые обычно заканчиваются настройками по умолчанию для нескольких библиотек), оптимальный выбор очень зависит от набора данных. Использование тех из бумаги - хорошая отправная точка, чтобы иметь базовую линию, но никогда не позволяйте чем-то помешать вам изменить их.

Другим важным моментом является функция потерь, функция потерь, которая может хорошо работать для сегментирования автомобилей (они большие, более 20% изображения), может не работать для чего-то вроде текста (маленький, меньше 1% изображения).

Если у вас двоичная сегментация, важно также использовать пороговое значение для определения, является ли пиксель нужным вам классом.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...