Каково значение случайного масштаба / кадрирования / яркости в классификаторе изображений - PullRequest
0 голосов
/ 28 апреля 2018

Когда мы переобучаем слой классификатора изображений в Mobilenet, скрипт переобучения позволяет нам указать несколько параметров для предварительной обработки входных изображений:

random_scale random_crop random_brightness

Хотелось бы узнать, как определить эти значения? Я видел в некоторых статьях, что для random_brightness и random_scale установлено значение 30, а для random_crop установлено значение 0.

Может кто-нибудь помочь мне понять эти параметры?

1 Ответ

0 голосов
/ 28 апреля 2018

Нашел ответ по этой ссылке: https://github.com/tensorflow/hub/blob/master/docs/tutorials/image_retraining.md

Распространенным способом улучшения результатов тренировки с изображениями является деформация, обрезка или повышение яркости входных данных для обучения случайным образом. Это имеет преимущество в увеличении эффективного размера обучающих данных благодаря всем возможным вариациям одних и тех же изображений и помогает сети научиться справляться со всеми искажениями, которые будут возникать при использовании классификатора в реальной жизни. Самый большой недостаток включения этих искажений в нашем сценарии заключается в том, что кеширование узкого места больше не является полезным, поскольку входные изображения никогда точно не используются повторно. Это означает, что учебный процесс занимает намного больше времени (много часов), поэтому рекомендуется попробовать это как способ полировки своей модели только после того, как у вас есть тот, которым вы достаточно довольны.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...