Машинное обучение на изображениях - это хорошая идея, чтобы расширить набор данных путем создания повернутых копий текущих изображений набора данных? - PullRequest
0 голосов
/ 26 июня 2018

У меня есть разные классы медицинских рентгеновских снимков, но их количество не равно.Количество изображений в каждом классе варьируется от десяти до тысяч.Если я не могу получить дополнительные изображения в каждом классе, целесообразно ли расширять текущий набор данных, создавая повернутые копии изображений в текущем наборе данных?

1 Ответ

0 голосов
/ 27 июня 2018

Вам нужно, чтобы количество изображений в каждом классе было одинаковым?Исходя из моего ограниченного понимания алгоритмов обработки тренировочных изображений, чем больше у вас изображений, тем больше уверенность в том, что ваш алгоритм работает для различных тестовых изображений.Поэтому, если вы тестируете свой алгоритм на разных частях тела, и у вас есть разное количество изображений для каждой из частей тела, то вы получите разные уровни достоверности того, насколько хорошо ваш алгоритм может работать на разных частях тела.тело (чем меньше тренировочных изображений, тем меньше вы будете уверены в том, что ваш алгоритм устойчив для различных входных изображений).

Разнообразие тестовых изображений является ключевым понятием.Вы предложили вращать изображения, чтобы сделать ваш алгоритм более разнообразным.Это может работать, но также может вызывать проблемы, поскольку ротация может создавать артефакты / искусственные ошибки в данных, которые никогда не присутствовали в исходных необработанных данных.Это может привести к неправильной тренировке вашего алгоритма (он может начать распознавать эти артефакты как объекты, когда эти функции никогда не будут присутствовать в исходных, непроверенных данных).

Таким образом, мой совет - найти способыполучения большего количества изображений вместо манипулирования вашим текущим ограниченным набором и возможной неправильной тренировки алгоритма.

...