Почему SSD изменяет размер случайных культур во время увеличения данных? - PullRequest
0 голосов
/ 13 февраля 2020

Бумага SSD детализирует свою схему произвольного увеличения данных:

Увеличение данных Чтобы сделать модель более устойчивой к различным входным объектам размеров и форм, каждое тренировочное изображение случайным образом выбирается одним из следующих параметров: - Использовать все исходное входное изображение. - Попробуйте патч так, чтобы минимальное совпадение jaccard с объектами составляло 0,1, 0,3, 0,5, 0,7 или 0,9. - Случайная выборка патча. Размер каждого сэмплированного патча составляет [0,1, 1] от исходного размера изображения, а соотношение сторон составляет от 1 до 2. Мы сохраняем перекрытую часть поля истинности, если его центр находится в сэмплированном. залатать. После вышеупомянутого шага выборки каждый выборочный участок изменяется до фиксированного размера и переворачивается по горизонтали с вероятностью 0,5, в дополнение к некоторым фотометрическим искажениям c, подобным описанным в [14]. https://arxiv.org/pdf/1512.02325.pdf

Мой вопрос заключается в следующем: каковы причины изменения размера сельскохозяйственных культур, которые варьируют в аспекте у крыс ios между 0,5 и 2,0?

Например, если ваше входное изображение имеет размер 300x300, изменение формы обрезки с разрешением AR = 2.0 до квадратного разрешения приведет к сильному растяжению объектов (квадратные объекты станут прямоугольными angular, круги станут эллипсами и т. Д. c.) I Понимание небольших искажений может быть полезно для улучшения обобщения, но обучение сети объектам, искаженным до двух раз в любом измерении, кажется контрпродуктивным. Я неправильно понимаю, как работает случайная обрезка?

[Редактировать] Я полностью понимаю, что увеличенные изображения должны быть того же размера, что и оригинал - мне больше интересно, почему авторы не фиксируют соотношение сторон до 1,0, чтобы сохранить пропорции объекта.

Ответы [ 2 ]

0 голосов
/ 17 февраля 2020

Лично я считаю, что любое преобразование имеет смысл до тех пор, пока вы, как человек, все еще можете идентифицировать объект / субъект, и до тех пор, пока они имеют смысл в восприимчивом поле сети. Также я предполагаю, что соотношение сторон может помочь в изучении какого-либо искажения перспективы (посмотрите на корову на рис. 5, она как бы «сжата»). Такие объекты, как чашка, дерево, стул, даже растянутый, все еще можно идентифицировать. В противном случае вы могли бы также учитывать, что некоторые точечные или наклонные преобразования просто не имеют смысла.
Тогда, если вы работаете с изображениями, отличными от естественных изображений, без перспективы, это, вероятно, не очень хорошая идея. так. Если на вашем изображении показаны объекты фиксированного известного размера, такие как микроскоп или другое медицинское устройство визуализации, и если ваш объект имеет более или менее фиксированный размер (скажем, ячейку), то, вероятно, не стоит делать сильные искажения на масштаб (например, ячейка в два раза больше), может быть, тогда ячейка, в два раза больше эллипса, имеет больше смысла.
С помощью этой библиотеки вы можете выполнять сильные аугментации, но не все из них имеют смысл если вы посмотрите на изображение здесь:
enter image description here

0 голосов
/ 13 февраля 2020

Архитектура GPU заставляет нас использовать пакеты для ускорения обучения, и эти пакеты должны быть одинакового размера. Использование не слишком искаженных изображений может сделать тренировку более эффективной, но намного медленнее.

...