У меня есть классификатор, который принимает изображение человека в качестве входных данных.
Я проверяю точность этого классификатора, используя 10-кратную перекрестную проверку, например:
cv = ShuffleSplit(n_splits=10, test_size=0.1, random_state=0)
scores = cross_val_score(clf, features, tags, cv=cv)
Однако яХотелось бы, чтобы shuffle / split не был настолько случайным и учитывал определенное условие.
Например, скажем, у меня есть набор данных с 10 000 изображений, но только с 10 разными людьми.
Так что я бы хотел, чтобы условием перемешивания / разделения было идентификатор человека.разделите данные так, чтобы изображения 1 человека были либо на тренировочном наборе, либо на тестовом наборе, а не на обоих.
Существует ли такая вещь?