Я пытаюсь использовать семантическую сегментацию, чтобы идентифицировать центр зрачка на изображениях глаз, сегментируя радужную оболочку. У меня есть небольшой набор данных из 1300 изображений до увеличения путем поворота / зеркального отражения - в расширенном наборе 5200 изображений. Я использую партии размером 5 и 60 эпох. Я пробовал различные архитектуры, такие как Unet, которые выводили только пустые изображения, и другие более простые, такие как на изображении ниже, которые выводили только шум. Я включил пример ввода, его метку и вывод, который я получаю. Я также включил пример тренировочного графика. Что мне нужно сделать по-другому, чтобы начать получать выходные данные, которые на самом деле выглядят как метки? Вверху слева: входное изображение из обучающего набора, затем вывод CNN, затем метка, которую он должен был вывести. Справа вверху - тренировочный график. Внизу: пример более простой модели, которую я пробовал.