Разделение данных в обучении / тестировании / валидации по группам в питоне - PullRequest
0 голосов
/ 05 апреля 2019

Мне нужно разделить видеоданные таким образом, чтобы один и тот же человек не мог быть в обоих train_set и test_set, а затем не может быть в обоих train_set и validation_set split.

X: массив данных numpy

y: numpy массив целевых

groups: numpy массив групп (с именем человека)

Я могу легко разделить поезд и проверить, чтобы заархивировать мое деление:

kf = GroupKFold(n_splits=10) 
for train_index, test_index in kf.split(X, y,groups=groups):
        X_train, X_test = X[train_index], X[test_index]
        y_train, y_test = y[train_index], y[test_index]

тогда мне нужно разделить X_train, чтобы получить набор проверки, который не содержит одного и того же человека в поезде.Мне просто нужно сбросить, моя проблема в том, что я теряю свои индексы после первого деления, поэтому я не могу снова использовать массив groups.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...