Быстрое увеличение набора данных в Python - глубокое обучение - PullRequest
0 голосов
/ 09 апреля 2020

Я работаю над проектом, в котором требуется увеличение данных. Я хотел перевернуть изображение по горизонтали и добавить его в массив данных тренировки. Проблема в том, что там более 10000 изображений.

Это код для ручного переворачивания каждого изображения (массив 2d numpy) в массиве train_images длины 'size'.

for img in range(0, size):
  flip = np.flip(train_images[img], axis=1)
  np.append(train_images, flip)
  np.append(train_labels, train_labels[img])

Это занимает довольно много времени. Существует ли какая-либо библиотечная функция или более быстрый способ вычисления новых изображений и добавления их в массив без многопоточности?

Заранее благодарим вас за ваши комментарии.

1 Ответ

1 голос
/ 09 апреля 2020

Я использую библиотеку imgaug для систематического увеличения данных c. Это очень полезно и имеет отличный дизайн на случай, если вам нужно сделать несколько дополнений к одному изображению. У меня есть немного кривой обучения, но оно того стоит.

...