Я получил этот набор данных, который состоит из изображений и их меток. Я загружаю их, используя пользовательскую функцию, которую я написал. Проблема, с которой я столкнулся, заключается в том, что я не знаю, как правильно разделить их между тренировками и тестированием. Я просматривал документацию по TensorFlow и нашел что-то, но они не достаточно объяснительны.
def create_training_data():
_images = []
_labels = []
for category in CATEGORIES:
class_num = CATEGORIES.index(category)
new_path = os.path.join(DATASET, category)
for img in os.listdir(new_path):
img_array = cv2.imread(os.path.join(new_path, img), cv2.IMREAD_GRAYSCALE)
_images.append(img_array)
_labels.append(class_num)
return (_images, _labels)
Вот как я загружаю данные в данный момент
(training_images, training_labels) = create_training_data()
training_images = np.array(training_images)
training_images = training_images / 255.0
Как можно Возможно, я разделил его между тренировками и тестированием с размером тестов 0,3?