У меня ограниченный набор данных изображений котов / кошек, и я пытаюсь увеличить его, поворачивая изображения и добавляя оттенки серого. К сожалению, кажется, что они не улучшают точность, когда я добавляю их обратно в набор данных, поэтому я думаю о дополнительных методах дополнения. Следующие функции используются для изменения набора данных. Буду признателен за любые предложения, касающиеся самих функций и других стратегий расширения. В качестве примечания, я не могу использовать модель, которую я должен придерживаться, чтобы изменить размеры изображений, чтобы форма не могла измениться, поэтому я перераспределяю свой серый обратно в 3 канала RGB.
Если бы вы могли предложить другие методы или улучшить мои существующие, я был бы очень признателен. Так как они, кажется, не оказывают большого влияния / различия.
def rotator1(img):
return np.rot90(img, k=1, axes=(0, 1))
def rotator2(img):
return np.rot90(img, k=2, axes=(0, 1))
В приведенном ниже коде я перераспределяю серый обратно в другие 3 канала, потому что я хочу сохранить размеры одинаковыми.
def rgb2gray(img):
grey=np.dot(img[...,:3], [0.2989, 0.5870, 0.1140])
gray=np.dstack((grey, grey, grey))
return gray