Случайно выбирая несколько файлов из папки и читая их в cv2 - PullRequest
0 голосов
/ 21 апреля 2019

Я создаю CNN с Python, и мой набор данных содержит около 14 тыс. Изображений и 6 меток, из-за чего для запуска нейронной сети требуется много времени. Все мои ярлыки находятся в разных папках с именами ярлыков в качестве имен папок, и я хотел бы случайным образом выбрать 500 изображений из каждой папки для запуска CNN. Я написал ниже код

imageset = []
labels =[]
mountain = os.listdir('../folder/mountain')
glacier = os.listdir('../folder/glacier')

filenames = random.sample(mountain, 500)

for i in filenames :
    image = cv2.imread('../folder/mountain/'+i,cv2.IMREAD_COLOR)
    image_size =cv2.resize(image,(50,50))
    imageset.append(np.array(image_size))
    labels.append(3)

#for fname in filenames:
train_images =np.array(imageset)
print(train_images.shape)

Поскольку я случайно выбрал 100 изображений из папки, print(train_images.shape) должен дать мне (500,50,50,3). Но это показывает фактическое количество изображений (3000,50,50,3).

...