Я создаю CNN с Python, и мой набор данных содержит около 14 тыс. Изображений и 6 меток, из-за чего для запуска нейронной сети требуется много времени. Все мои ярлыки находятся в разных папках с именами ярлыков в качестве имен папок, и я хотел бы случайным образом выбрать 500 изображений из каждой папки для запуска CNN. Я написал ниже код
imageset = []
labels =[]
mountain = os.listdir('../folder/mountain')
glacier = os.listdir('../folder/glacier')
filenames = random.sample(mountain, 500)
for i in filenames :
image = cv2.imread('../folder/mountain/'+i,cv2.IMREAD_COLOR)
image_size =cv2.resize(image,(50,50))
imageset.append(np.array(image_size))
labels.append(3)
#for fname in filenames:
train_images =np.array(imageset)
print(train_images.shape)
Поскольку я случайно выбрал 100 изображений из папки, print(train_images.shape)
должен дать мне (500,50,50,3)
. Но это показывает фактическое количество изображений (3000,50,50,3)
.